nvidia deepseek r1 - 搜索 News

6 小时

DeepSeek-R1 质疑了这样一种假设，即通过对正确或错误行为的标记示例进行训练，或者从隐藏模式中提取信息，模型的推理能力就会得到提高。密歇根州立大学博士生张逸骅撰写了数十篇机器学习方面的论文，他说：“它的核心假设很简约，却不那么简单：我们能否只通过奖励信号来教会模型正确回答，从而让它自己摸索出最优的思考方式？” ...

来自MSN3 天

诺贝尔奖得主：DeepSeek目前只算是“玩具” 但它戳破硅谷AI投资盲点

在人工智能领域，近期中国公司DeepSeek的崛起引起了各方关注。这家公司推出的R1模型以其低成本与高性能吸引了不少眼球，震撼了硅谷及华尔街。然而麻省理工学院（MIT）经济学教授、诺贝尔经济学奖得主艾塞默鲁（Daron ...

3 天

李飞飞团队50美元训练出媲美DeepSeek的AI推理模型？真相来了

2025 年 2 月，斯坦福大学和华盛顿大学的研究人员宣布，他们成功训练出了一个名为 s1 的人工智能推理模型。据报道，该模型的训练成本极低，仅需不到 50 美元的云计算费用，且仅用了 16 个英伟达 H100 GPU 进行了 26 ...

6 天

Hugging Face研究人员构建OpenAI深度研究工具“开放”版本

Hugging Face 的团队，包括公司联合创始人兼首席科学家 Thomas Wolf，表示他们的开放深度研究项目结合了 OpenAI 的 o1模型和一个开源的 “代理框架”。这个框架旨在帮助模型更好地进行信息分析，并指导其使用搜索引擎等工具。尽管 o1是一个付费的专有模型，研究人员认为它在性能上优于一些开放模型，如 DeepSeek 的 R1。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果