DeepSeek取得的震惊外界的成绩,基本上都是基于H800智算集群。H800是英伟达向美国政府芯片出口管制妥协的产物,计算能力与最先进的H100相当,但带宽较低。DeepSeek恰好此前在A100上做了很多减少内存与带宽开销的尝试。
吴恩达的观点很快得到了印证。最新消息称,“AI教母”李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练出一个名为S1的人工智能推理模型,其数学和编码能力在测试中的表现达到了OpenAI o1和DeepSeek R1的水平。
在训练框架上,Deepseek-V3团队打造了HAI-LLM框架,并进行了细致的工程优化。首先是设计了DualPipe(双管道)算法以实现高效的管道并行,并实现了计算和通信重叠(而不是按照串行模式,完成计算再进行通信),从而解决了跨节点专家并行带来的 ...
最近,市场已经传出DeepSeek正在以80亿美元估值融资的消息。陈昱认为,当下VC再去围追堵截DeepSeek没有任何意义,眼下更重要的是将目光转向AI产业链的其他变革机会上,例如具身智能、边缘计算、智能硬件,还有众多独立应用的机会。
DeepSeek能够屹立于AI舞台的中央,不仅在于其在大语言模型(LLM)上所取得的突破,更在于为AI开启了希望之门,而这也正是最大的悬念所在。凭借其一系列大模型,DeepSeek打破了AI大模型发展的传统范式——使用昂贵的GPU,消耗大量电力和资源 ...
DeepSeek的崛起标志着全球人工智能竞赛的“转折点”,证明中国可以利用更少的资源与大科技公司竞争。DeepSeek发布的较低成本的开源AI模型爆火,这也让OpenAI重新思考,需要“弄清楚另一种开源战略”。外媒表示,尽管不太可能很快看到OpenA ...
2024年中芯国际的资本开支约为73.3亿美元(约500亿元人民币),与2023年持平。2025年资本开支预计也将与2024年持平,表明中芯国际的扩产步伐没有放缓。 资本开支的持续高水平预示着半导体设备、材料等上下游供应链的需求仍然强劲。特别是半导体设备和材料公司,如 北方华创 、 中微公司 、 南大光电 、 彤程新材 等,受益于这一趋势,未来可能会迎来业绩的改善。
DeepSeek的“鲶鱼效应”正在加速。 2月13日,文心一言宣布,4月1日起全面免费,同时上线深度搜索功能。此前,百度基于文心一言 4.0 Turbo推出的专业版会员服务定价为59.9元/月。
在中国新兴企业DeepSeek宣布以低成本开发出AI模型的消息后,人们对图形处理器(GPU)的价格产生了浓厚的兴趣。分析师指出,DeepSeek所采用的美国英伟达(NVIDIA)的GPU市场价格比美国同行所使用的尖端产品低了10%到30%。这种价格虽然没有极端便宜,但却值得我们关注。
TechWeb 文/ 果青题图/ 豆包AI2月6日,据国内AI产品榜 aicpb.com数据,DeepSeek 应用(APP) 2025/01/11 日发布,截止 1/31 日上线仅 21 天。日活跃用户DAU ...
SemiAnalysis预估, DeepSeek使用大约5万个Hopper GPU来做训练,当然正如一些人所声称的那样,这并不等同于5万个H100。
摩根士丹利此前对中国股市持低配的观点,原因是出于对贸易关税、盈利下行等不确定性的担忧。但该机构最新发布的报告已有所改观。“目前投资者逐步认识到,中国的AI发展可能不需要大规模资本投入,即便高端GPU供应受限,仍然具备缩小甚至弥合技术差距的能力。中美竞 ...