Deepseek V3 H100 GPU - 搜索 News

12 小时

20万张GPU，号称“地球上最聪明的AI”Grok-3来了，斩获多个Top1，网友 ...

北京时间 2 月 18 日中午，埃隆·马斯克旗下的人工智能公司 xAI 重磅发布了 Grok 3 系列模型，宣称其在数学、科学和编码基准测试中，击败了 Google Gemini、DeepSeek V3、Claude 以及 OpenAI 的 ...

腾讯网1 天

10 万GPU烧出 AI 怪物，马斯克 Grok-3 硬刚 DeepSeek

“10 万张 H100 GPU 训练”、“证明黎曼猜想”、“最聪明的 AI”。Grok-3 未发布就赚足了眼球，今天中午，一如既往的迟到后，被马斯克称为“Smartest AI on Earth”的 Grok-3 ...

4 小时

英伟达一夜回血！马斯克狂烧30亿GPU给老黄续命，10倍算力创Scaling Law ...

一度狂跌的英伟达股价，又被Grok-3盘活了？20万块GPU训出的模型超越DeepSeek和OpenAI，证明Scaling Law还在继续增长！Ai2研究者大佬直言：Grok-3，就是DeepSeek给美国AI企业压力的又一力证。

知乎 on MSN11 小时

马斯克20万块GPU炼出Grok-3，暴击DeepSeek R1数学屠榜！疯狂复仇OpenAI

编辑：编辑部 HNYZ 【新智元导读】马斯克口中全世界最聪明大模型Grok-3，终于震撼登场！20万块GPU训出的模型，实属全球首次。果然，Grok-3已火速屠榜多个排行榜，击败o3-mini（high）和DeepSeek-R1。

腾讯网23 天

AMD火速“站台”DeepSeek，利空英伟达？美国私募：GPU市场格局或被 ...

不再需要最先进的芯片来训练大模型，“DeepSeek-V3模型是在英伟达H800上训练的，这是英伟达为中国客户定制的速度较慢的GPU。然而，AMD的MI 300X GPU在关键基准测试中表现优于H100。因此，DeepSeek可以在AMD GPU上支持最先进的模型训练。” 免责声明：本文内容与数据 ...

腾讯网8 小时

DeepSeek满血微调秘籍开源！站在巨人肩膀打造私有模型，教程在此

在准备好数据集和模型权重后，可使用Colossal-AI 提供的一键启动脚本 ...

腾讯网8 小时

DeepSeek V3+R1满血微调工具上线！一键启动，硬件要求降10倍

机器之心发布机器之心编辑部DeepSeek V3/ R1 火爆全网，基于原始模型的解决方案和 API ...

日经中文网8 天

DeepSeek所用GPU或比尖端产品便宜1～3成

随着中国新兴企业DeepSeek宣布以低成本开发出AI模型，图形处理器（GPU）的价格备受关注。有分析认为，DeepSeek使用的美国英伟达的GPU市场价格比美国企业使用的尖端产品便宜1～3成左右。似乎并不是极端便宜。

6 天

DeepSeek低成本GPU技术引发AI行业关注，开发效率如何提升？

值得注意的是，尽管DeepSeek通过降低GPU成本显著提高了AI模型的开发效率，但市场竞争仍然残酷。美国企业在资金和人才方面的优势依然明显，他们在技术开发中的步伐不容小觑。未来，AI行业的竞争将愈演愈烈，DeepSeek及其他企业需要继续优化成本结构，提升技术能力，以应对市场挑战。

10 小时

马斯克狂吹Grok 3，吊打梁文锋DeepSeek-R1！用了20万块英伟达GPU

当地时间2月17日18时，即北京时间2月18日12点，埃隆•马斯克（Elon Musk）的AI公司xAI正式推出最新的Grok 3模型，并称其是目前“地球上最聪明的AI”。在不久前的迪拜世界政府峰会上，马斯克就给Grok ...

8 天

DeepSeek-V3芯片成本优势显著，AI模型开发迎来新突破

随着AI技术的不断进步，芯片成本的降低将为更多企业提供了进入AI领域的门槛。DeepSeek-V3的成功开发展示了在成本控制下依然能够实现高性能AI模型的可能性。这一消息不仅为行业内的企业提供了新的选择，也为AI技术的普及和应用提供了更多的可能性。

新浪网10 天

我们应如何看待DeepSeek的557.6万美元训练成本？

Meta技术报告显示，Llama 3.1 405B的预训练时长54天，使用了15万亿（15T）的tokens以及1.6万个英伟达H100 GPU进行训练。 DeepSeek-V3在预训练阶段，使用了14.8万 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果