Deepseek V3 FP8 - 搜索 News

5 小时

FP8模型不再挑卡！DeepSeek推理成本减半速度翻番，清华团队开源「 ...

当前，拥有完整自主可控的 AI 技术栈已成为国家战略性需求。DeepSeek、QwQ 等优秀的国产开源大模型正在重塑全球科技产业格局，但在大模型推理部署领域，业界仍高度依赖国外开源工具。

13 天

DeepSeek V3技术解密：程序员必看的开源大模型实战指南！

其中，深度求索科技推出的第三代大规模混合专家（MoE）模型DeepSeekV3，凭借其高达6710亿的总参数量、长上下文支持、每个Token仅激活21亿参数和FP8优化技术等，成为该系列的旗舰模型，是当前语言模型领域的顶尖代表之一。

20 小时

小白读懂DeepSeek：从MoE到MLA，国产AI如何改变世界？

对于这个问题，其实有不少专业文章都做过解释，不过大家未必会想去看万字长文，也对枯燥的学术概念没啥兴趣。所以小雷这次打算用通俗易懂的方式，向大家解释一下DeepSeek在AI模型的训练和设计中，到底有哪些让人眼前一亮的创新。

腾讯网16 天

DeepSeek开源第三弹！极致榨干GPU，FP8训推秘籍公开

智东西（公众号：zhidxcom）作者 | ZeR0编辑 | 漠影智东西2月26日报道，刚刚，DeepSeek开源周第三弹发布——DeepGEMM，一个支持密集和MoE GEMM的FP8 GEMM库，为V3/R1训练和推理提供动力。 Hopper GPU上性能高达1350+ FP8 TFLOPS 没有过多的依赖，像教程一样干净完全JIT即时编译（安装不用预编译） ...

知乎 on MSN2 天

DeepSeek 开源周第二天开源项目 DeepEP，有哪些亮点值得关注？

DeekSeek真真的OpenAI，低成本训练DeepSeek V3的关键通信优化代码开源了，而且支持FP8。之前DeepSeek V3技术报告出来后，很多人对它的低训练成本表示质疑，现在随着训练优化代码的开源，估计再也没有争议了。

15 天

DeepSeek V3/R1：3大技术革新及深度解析

总体来看，DeepSeek V3/R1不仅是一个简单的更新换代，而是一种对AI技术的重新定义。在推动数字化变革的同时，DeepSeek还为行业带来了许多可借鉴的经验和教训。对于消费者而言，随着技术进步的不断推进，这意味着将有更多更高效的工具可供选择。在此背景下，建议业内人士积极参与讨论，分享自身在使用DeepSeek及其技术过程中的经验与见解，共同推动这一领域的持续进步。返回搜狐，查看更多 ...

11 天

DeepSeek全面开源V3/R1推理系统！成本利润率高达545%

在过去24小时内（02月27日中午12:00至02月28日中午12:00），V3和R1推理服务的合计峰值节点占用达到278个，平均占用226.75个节点（每个节点包含8个H800 GPU）。

36氪15 天

DeepSeek开源第三弹，极致榨干GPU，FP8训推秘籍公开

智东西2月26日报道，刚刚，DeepSeek开源周第三弹发布——DeepGEMM，一个支持密集和MoE GEMM的FP8 GEMM库，为V3/R1训练和推理提供动力 ...

腾讯网13 天

DeepSeek一天能赚多少钱？官方揭秘V3/R1推理系统，成本全透明

机器之心报道机器之心编辑部DeepSeek 官方：如果所有 tokens 全部按照 DeepSeek R1 的定价计算，理论上一天的总收入为 $562,027，成本利润率 545%。但实际上没有这么多收入，因为 V3 ...

11 天

新加坡抓了9个人！指其向中国DeepSeek倒卖NVIDIAGPU最高可判20年

根据NVIDIA官方公布的财报，截止2025年1月26日的最新季度内，新加坡客户贡献了18％的收入，而且同比大幅增加了近2.5倍，远超其他任何地区，但是只有2％的芯片最终发往新加坡。随后，新加坡贸易和工业部副部长Tan See ...

来自MSN1 个月

AMD Instinct GPU助力DeepSeek-V3，FP8精度训练性能飞跃提升！

同时，它也助力开发者打造出强大的视觉推理和理解应用。 DeepSeek-V3采用了FP8低精度训练，而AMD ROCm平台对FP8的支持极大优化了计算过程，特别是 ...

电脑之家PChome.net on MSN15 天

原生FP8计算摩尔线程高效完成DeepSeek FlashMLA适配

自DeepSeek启动“开源周”以来，已陆续开源三个代码库。摩尔线程基于全新MUSA Compute Capability ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果