SemiAnalysis预估, DeepSeek使用大约5万个Hopper GPU来做训练,当然正如一些人所声称的那样,这并不等同于5万个H100。
随着中国新兴企业DeepSeek宣布以低成本开发出AI模型,图形处理器(GPU)的价格备受关注。有分析认为,DeepSeek使用的美国英伟达的GPU市场价格比美国企业使用的尖端产品便宜1~3成左右。似乎并不是极端便宜。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,其起源于一家中国的对冲基金公司High-Flyer。2023年5月High-Flyer剥离出一个独立实体,也就是DeepSeek。这是一家致力于打造高性能、低成本的 AI ...
DeepSeek的崛起标志着全球人工智能竞赛的“转折点”,证明中国可以利用更少的资源与大科技公司竞争。DeepSeek发布的较低成本的开源AI模型爆火,这也让OpenAI重新思考,需要“弄清楚另一种开源战略”。外媒表示,尽管不太可能很快看到OpenA ...
遥想两年前,ChatGPT给了世界一记AI冲击,而DeepSeek无疑是第二记冲击。我们不仅对DeepSeek强劲的性能所震撼,也让远在大洋彼岸的OpenAI、谷歌、META等一众玩家感受到莫大压力,从而纷纷继续“卷”起来,效仿DeepSeek的“开 ...
2月4日,国产全功能GPU创新企业摩尔线程宣布,实现了对 DeepSeek 蒸馏模型推理服务的部署。通过DeepSeek提供的蒸馏模型,能够将大规模模型的能力迁移至更小、更高效的版本,在国产GPU上实现高性能推理。
在中国新兴企业DeepSeek的最新AI模型开发中,GPU的成本问题引发了广泛关注。分析人士指出,DeepSeek所使用的英伟达H800 GPU与美国企业所使用的顶尖H100产品相比,其市场价格低了约10%至30%,虽不算极端便宜,但仍引发了不少讨论。
AMD数据中心GPU也第一时间实现了对DeepSeek-V3 模型的支持,且集成了SGLang优化以提供最佳性能。 近期,由深度求索(DeepSeek)发布的最新生成式AI大 ...
尽管H800与H100具有相同的计算能力 ... 在1月25日新年前,AMD就官宣将DeepSeek-V3模型集成到了Instinct MI300X GPU上。 随后在1月31日,AI芯片龙头英伟达也 ...
吴恩达的观点很快得到了印证。最新消息称,“AI教母”李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练出一个名为S1的人工智能推理模型,其数学和编码能力在测试中的表现达到了OpenAI o1和DeepSeek R1的水平。
在AI领域,DeepSeek系列模型的发布如同一颗震撼弹,引起了业界的广泛关注。去年12月26日,DeepSeek ...