北京时间 2 月 18 日中午,埃隆·马斯克旗下的人工智能公司 xAI 重磅发布了 Grok 3 系列模型,宣称其在数学、科学和编码基准测试中,击败了 Google Gemini、DeepSeek V3、Claude 以及 OpenAI 的 ...
“10 万张 H100 GPU 训练”、“证明黎曼猜想”、“最聪明的 AI”。Grok-3 未发布就赚足了眼球,今天中午,一如既往的迟到后,被马斯克称为“Smartest AI on Earth”的 Grok-3 ...
一度狂跌的英伟达股价,又被Grok-3盘活了?20万块GPU训出的模型超越DeepSeek和OpenAI,证明Scaling Law还在继续增长!Ai2研究者大佬直言:Grok-3,就是DeepSeek给美国AI企业压力的又一力证。
11 小时
知乎 on MSN马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI编辑:编辑部 HNYZ 【新智元导读】马斯克口中全世界最聪明大模型Grok-3,终于震撼登场!20万块GPU训出的模型,实属全球首次。果然,Grok-3已火速屠榜多个排行榜,击败o3-mini(high)和DeepSeek-R1。
不再需要最先进的芯片来训练大模型,“DeepSeek-V3模型是在英伟达H800上训练的,这是英伟达为中国客户定制的速度较慢的GPU。然而,AMD的MI 300X GPU在关键基准测试中表现优于H100。因此,DeepSeek可以在AMD GPU上支持最先进的模型训练。” 免责声明:本文内容与数据 ...
在准备好数据集和模型权重后,可使用Colossal-AI 提供的一键启动脚本 ...
机器之心发布机器之心编辑部DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API ...
随着中国新兴企业DeepSeek宣布以低成本开发出AI模型,图形处理器(GPU)的价格备受关注。有分析认为,DeepSeek使用的美国英伟达的GPU市场价格比美国企业使用的尖端产品便宜1~3成左右。似乎并不是极端便宜。
值得注意的是,尽管DeepSeek通过降低GPU成本显著提高了AI模型的开发效率,但市场竞争仍然残酷。美国企业在资金和人才方面的优势依然明显,他们在技术开发中的步伐不容小觑。未来,AI行业的竞争将愈演愈烈,DeepSeek及其他企业需要继续优化成本结构,提升技术能力,以应对市场挑战。
当地时间2月17日18时,即北京时间2月18日12点,埃隆•马斯克(Elon Musk)的AI公司xAI正式推出最新的Grok 3模型,并称其是目前“地球上最聪明的AI”。 在不久前的迪拜世界政府峰会上,马斯克就给Grok ...
随着AI技术的不断进步,芯片成本的降低将为更多企业提供了进入AI领域的门槛。DeepSeek-V3的成功开发展示了在成本控制下依然能够实现高性能AI模型的可能性。这一消息不仅为行业内的企业提供了新的选择,也为AI技术的普及和应用提供了更多的可能性。
Meta技术报告显示,Llama 3.1 405B的预训练时长54天,使用了15万亿(15T)的tokens以及1.6万个英伟达H100 GPU进行训练。 DeepSeek-V3在预训练阶段,使用了14.8万 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果