Deepseek V3 FP8 - 搜索 News

事实上，现在全行业都在学习参考DeepSeek成功的秘密。据DeepSeek开发团队介绍，V3模型采用了模型压缩、多头潜在注意力机制（MLA）、混合专家模型（MoE）、FP8混合精度训练等一系列创新技术降低成本，R1模型又有组相对策略优化算法（GRPO）这一重要创新。

9 小时

巴黎AI峰会热议中国力量：不在场的DeepSeek为何成焦点？

法国总统马克龙在峰会上强调了技术中立性的重要性，呼吁各国根据技术对主权的潜在影响来评估技术，而非单纯依据其来源国。这一立场与美国的霸权心态形成了鲜明对比，进一步凸显了DeepSeek在全球AI格局中的独特地位和价值。

中华网16 小时

傅盛：DeepSeek是中国的ChatGPT时刻 AI安卓时刻来临

AI的安卓时刻正在到来，DeepSeek在全球范围内的生态圈迅速扩大，特别是在中国。2025年1月底，美国三大科技巨头英伟达、微软、亚马逊先后宣布接入DeepSeek的服务。此后，华为、百度、腾讯、阿里、京东、字节跳动等云计算大厂也相继在2月份宣布接 ...

9 小时

OpenAI迎战Deepseek

DeepSeek的崛起标志着全球人工智能竞赛的“转折点”，证明中国可以利用更少的资源与大科技公司竞争。DeepSeek发布的较低成本的开源AI模型爆火，这也让OpenAI重新思考，需要“弄清楚另一种开源战略”。外媒表示，尽管不太可能很快看到OpenA ...

21 小时

科大讯飞：纯国产算力的星火X1新版本预计在3月内完成

IT之家 2 月 13 日消息，科大讯飞今晚发布了最新的投资者关系活动记录表，主要针对 DeepSeek 方面的问题进行解答。科大讯飞表示，正在训练的纯国产算力的星火 X1 新版本预计在 3 月内完成，预期可以实现数学答题和过程思维链能力全面对标甚至超过 OpenAI o1。此外，科大讯飞还表示他们正在将 X1 深度推理模型进一步结合与中国教科院等诸多教育专家的合作，通过专业知识反思及长思维链 ...

2 小时

科大讯飞：纯国产算力的星火X1新版本预计在3月内完成，全面对标 ...

科大讯飞表示，飞正在训练的纯国产算力的星火 X1 新版本预计在 3 月内完成，预期可以实现数学答题和过程思维链能力全面对标甚至超过 OpenAI o1。此外，科大讯飞还表示他们正在将 X1 深度推理模型进一步结合与中国教科院等诸多教育专家的合作，通过专业知识反思及长思维链强化学习结合，生成符合教育教学需求的“教学思维链”，提高复杂场景推理的逻辑正确性、专业性、可解释性，并将率先用于教师助手、批改 ...

中国能源网6 小时

AI降本有望加速端侧应用和推理算力需求 | 投研报告

我们认为，deepseek系列开源大模型对AI产业发展带来新的启发。大模型可以依靠算法创新而不是算力堆叠来获得高性价比，更低的调用成本将加速AI应用的爆发。端侧AI应用有望加快落地，一方面云服务改善AI使用体验将促进移动端换机，有利于AI手机、眼镜等消费电子上量，另外，蒸馏小模型的本地部署将带动AIPC等换机，端侧SoC和存储芯片等将迎来利好。AI应用的扩大将加大推理端调用规模，推理端算力需求有望 ...

腾讯网11 小时

专家访谈汇总：中芯国际四季度迎来“逆袭”

1、《中芯国际，不止全球第二这么简单》摘要■全年归母净利润为36.99亿元，同比下降23.3%。尽管全年净利润下滑，但四季度的盈利能力有所回暖，主要受到新增12英寸产线优化产品组合的影响。■2024年中芯国际的资本开支约为73.3亿美元（约500亿元人民币），与2023年持平。2025年资本开支预计也将与2024年持平，表明中芯国际的 ...

凤凰网3 小时

DeepSeek打响头炮！国产芯片开打辅助：卷适配、卷落地、卷性价比

昆仑芯科技也表示，理论上，各类大模型的常规模型、常规组网能直接跑通，然而难免会出现特殊算子、特殊规模，需要投入人力进行针对性调试。跑通只是基础，后期涉及后端硬件不同、算子实现不同、对应软件版本不同等因素，精度对齐、性能对齐也都需要人力介入进行针对性适配。

商业新知 on MSN3 小时

DeepSeek引发国内AI全产业链共振

作者丨青风编辑丨六子 DeepSeek的冲击波仍然在持续扩散。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果