Deepseek V3 FP8 - 搜索 News

1 天

Deepseek的成功也带动了智能体的发展。谷歌、OpenAI、Anthropic、字节跳动等公司纷纷推出智能体产品，2025年有望成为AI智能体加速发展的元年。智能体市场呈现爆发式增长，预计到2030年全球智能体市场规模将达到471亿美元，复合年增 ...

16 天

DeepSeek V3技术解密：程序员必看的开源大模型实战指南！

其中，深度求索科技推出的第三代大规模混合专家（MoE）模型DeepSeekV3，凭借其高达6710亿的总参数量、长上下文支持、每个Token仅激活21亿参数和FP8优化技术等，成为该系列的旗舰模型，是当前语言模型领域的顶尖代表之一。

腾讯网19 天

DeepSeek开源第三弹！极致榨干GPU，FP8训推秘籍公开

智东西（公众号：zhidxcom）作者 | ZeR0编辑 | 漠影智东西2月26日报道，刚刚，DeepSeek开源周第三弹发布——DeepGEMM，一个支持密集和MoE GEMM的FP8 GEMM库，为V3/R1训练和推理提供动力。 Hopper GPU上性能高达1350+ FP8 TFLOPS 没有过多的依赖，像教程一样干净完全JIT即时编译（安装不用预编译） ...

3 天

FP8模型不再挑卡！DeepSeek推理成本减半速度翻番，清华团队开源「 ...

当前，拥有完整自主可控的 AI 技术栈已成为国家战略性需求。DeepSeek、QwQ 等优秀的国产开源大模型正在重塑全球科技产业格局，但在大模型推理部署领域，业界仍高度依赖国外开源工具。

1 天

小白读懂DeepSeek：从MoE到MLA，国产AI如何改变世界？

对于这个问题，其实有不少专业文章都做过解释，不过大家未必会想去看万字长文，也对枯燥的学术概念没啥兴趣。所以小雷这次打算用通俗易懂的方式，向大家解释一下DeepSeek在AI模型的训练和设计中，到底有哪些让人眼前一亮的创新。

爱范儿19 天

一文看懂 DeepSeek 开源项目第三弹，300 行代码揭示 V3/R1 推理效率背后 ...

今天出场的是 DeepGEMM，是一个专为干净、高效的 FP8 通用矩阵乘法 (GEMM) 而设计的库，具有细粒度缩放功能，如DeepSeek-V3中所述。它支持普通和混合 ...

36氪18 天

DeepSeek开源第三弹，极致榨干GPU，FP8训推秘籍公开

智东西2月26日报道，刚刚，DeepSeek开源周第三弹发布——DeepGEMM，一个支持密集和MoE GEMM的FP8 GEMM库，为V3/R1训练和推理提供动力 ...

14 天

DeepSeek全面开源V3/R1推理系统！成本利润率高达545%

在过去24小时内（02月27日中午12:00至02月28日中午12:00），V3和R1推理服务的合计峰值节点占用达到278个，平均占用226.75个节点（每个节点包含8个H800 GPU）。

腾讯网16 天

DeepSeek一天能赚多少钱？官方揭秘V3/R1推理系统，成本全透明

机器之心报道机器之心编辑部DeepSeek 官方：如果所有 tokens 全部按照 DeepSeek R1 的定价计算，理论上一天的总收入为 $562,027，成本利润率 545%。但实际上没有这么多收入，因为 V3 的定价更低，同时收费服务只占了一部分，另外夜间还会有折扣。太突然了！原来 DeepSeek 也有 One More Thing。就在所有人以为 DeepSeek ...

快科技18 天

原生FP8！摩尔线程GPU闪电适配DeepSeek开源库FlashMLA、DeepGEMM

快科技2月26日消息，DeepSeek启动“开源周”以来，已经陆续开源了三个代码库，而作为国产GPU的代表，摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。

知乎 on MSN5 天

DeepSeek 开源周第二天开源项目 DeepEP，有哪些亮点值得关注？

DeekSeek真真的OpenAI，低成本训练DeepSeek V3的关键通信优化代码开源了，而且支持FP8。之前DeepSeek V3技术报告出来后，很多人对它的低训练成本表示质疑，现在随着训练优化代码的开源，估计再也没有争议了。

18 天

原生FP8！摩尔线程GPU闪电适配DeepSeek开源库FlashMLA、DeepGEMM

快科技2月26日消息， DeepSeek启动“开源周”以来，已经陆续开源了三个代码库，而作为国产GPU的代表，摩尔线程已经快速完成对FlashMLA、DeepGEMM的适配。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果