Math图片 - 搜索 News

来自MSN3 天

Foretellix与MathWorks整合技术助力马自达加速研发AD/ADAS系统

盖世汽车讯 ...

3 天

留学|重磅！爱德思官宣！中国启用 A-Level 数学“区域卷”，考生又当 ...

近日，爱德思（Edexcel）官方宣布国际 A Level 数学（IAL Mathematics） ...

1 天

4岁开卖柠檬水，被全食看中，这个“小女孩”用14年把柠檬水卖进 ...

而食品饮料行业也有这样的故事，这个品牌是Me & the Bees Lemonade。它的创始人刚开始卖柠檬水时只有4岁，但就是这个4岁的小女孩从家门口的柠檬水摊位起步，用14年把蜂蜜柠檬水卖进美国6000个门店，成为全国性品牌。

2 天

DeepSeek概念躺赢的五大王者，个个被机构重仓上千万股，未来或将 ...

1月27日，DeepSeek强势登顶苹果App Store中国区免费应用榜首，在其影响下，美国芯片巨头英伟达（NVIDIA）股价跌超17%，台积电跌超13%，美光科技跌超11%，累计跌幅或超万亿美金。

4 天

李飞飞团队50美元训练出媲美DeepSeek的AI推理模型？真相来了

2025 年 2 月，斯坦福大学和华盛顿大学的研究人员宣布，他们成功训练出了一个名为 s1 的人工智能推理模型。据报道，该模型的训练成本极低，仅需不到 50 美元的云计算费用，且仅用了 16 个英伟达 H100 GPU 进行了 26 ...

腾讯网5 天

北大才女李飞飞，花了363元，做出媲美DeepSeek的AI模型

李飞飞等斯坦福大学和华盛顿大学的研究人员，站在开源模型Qwen2.5的肩膀上，训练成本仅花了不到50美元，就成功训练出了s1的AI推理模型，性能媲美OpenAI！ s1模型论文的作者，斯坦福大学在读博士 Niklas ...

每日经济新闻 on MSN5 天

李飞飞团队“50美元”复刻DeepSeek-R1？一文读透“白菜价”背后的真正 ...

2月6日，据外媒报道，李飞飞等研究人员用不到50美元和16张英伟达H100 ...

1 天

日活超越豆包，用户规模超ChatGPT只是时间问题！深度解析DeepSeek究竟 ...

另一家统计机构QuestMobile给出的数字更加激进，它表示，DeepSeek的日活跃用户在1月28日首次超越豆包（约1695万），随后在2月1日突破3000万大关——按SimilarWeb的数据计算，ChatGPT获得同样规模的日活用了11个月时 ...

来自MSN1 天

实测告诉你：DeepSeek-R1 7B、32B、671B差距有多大？

DeepSeek-R1 7B、32B、671B差距有多大？先说结论，相比“满血版”671B的DeepSeek-R1，蒸馏版差不多就是“牛肉风味肉卷”和“牛肉卷”的差距… 最近Deepseek成为了AI圈中最火爆的话题，一方面通过稀疏激活的MoE架构 ...

6 天

多模态DeepSeek来了！杨耀东团队联合港科发布Align-DS-V，助力灵初DS-VLA ...

在当前AI领域的快速发展中，“强推理慢思考”已经成为主要的发展动向之一，它们深刻影响着研发方向和投资决策。如何将强推理慢思考进一步推广到更多模态甚至是全模态场景，并且确保和人类的价值意图相一致，已成为一个极具前瞻性且至关重要的挑战。

腾讯网4 天

前DeepSeek科学家万字大揭秘，RL与MoE如何点燃大模型革命

图片来源：UnsplashZ Highlights在LoRA中，每一个专家都会被训练；而ESFT会优先微调适合做某个任务的专家，其他专家不会被过拟合，因此相比LoRA会有更强的泛化能力——让专业的人做专业的事。林纳斯说过，Talk is cheap, ...

来自MSN4 天

排名 Top 5 的 DeepSeek 相关开源项目

之前提到过，DeepSeek 发布的 R1 模型凭借低成本、高性能推理能力引发全球 AI 社区震动。在 GitHub 搜索 DeepSeek 关键词，除了深度求索官方的开源仓库外。我整理了排序最靠前的 5 个开源项目。 DeepSeek 复现狂潮 DeepSeek 的核心思路是通过强化学习优化小模型性能，被多个开源项目成功复现。包括这三个代表性项目：Hugging Face的 Open-R1、港 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果