Deepseek V3 FP8 - 搜索 News

4 小时

春节期间DeepSeek登顶中国、美国、德国等全球超100个国家和地区的iOS应用总榜第1，下载量超越ChatGPT；上线20天，日活用户突破2000万；72小时内16家国内芯片企业完成适配；国内外云计算平台争先恐后上线支持，国内三大运营商集体接入其 ...

11 小时on MSN

DeepSeek热潮下，大模型算力需求如何被重构？

在DeepSeek掀起的技术风暴中，一个广泛流传的观点认为大模型的算力需求或许正面临泡沫，存在过剩风险。然而，深入分析这一现象，我们发现事实远非如此简单。

腾讯网11 小时

DeepSeek崛起，算力需求重构进行时 | ToB产业观察

DeepSeek爆火之后，一个普遍的误读是——大模型算力存在泡沫，有过剩的风险。在DeepSeek-V3和R1模型之前，大模型行业信奉“算力即权力，规模即护城河”的逻辑，当DeepSeek用不到同行十分之一的价格训练出效果更优的大模型，自然引起了对大 ...

12 小时

DeepSeek风暴席卷AI产业链 | 商业头条No.61

受DeepSeek的启发，方汉已经考虑在昆仑万维后续的模型训练中应用GPRO等算法。他甚至认为这是“T0级别”的创新，“未来怎么把它泛化到除了数学跟编程之外的其他的垂类领域，以及其他的模态，我认为这是非常有价值的。” ...

腾讯网13 小时

DeepSeek风暴席卷AI产业链

最近，市场已经传出DeepSeek正在以80亿美元估值融资的消息。陈昱认为，当下VC再去围追堵截DeepSeek没有任何意义，眼下更重要的是将目光转向AI产业链的其他变革机会上，例如具身智能、边缘计算、智能硬件，还有众多独立应用的机会。

15 小时

科大讯飞：纯国产算力的星火X1新版本预计在3月内完成，全面对标 ...

科大讯飞表示，飞正在训练的纯国产算力的星火 X1 新版本预计在 3 月内完成，预期可以实现数学答题和过程思维链能力全面对标甚至超过 OpenAI o1。此外，科大讯飞还表示他们正在将 X1 深度推理模型进一步结合与中国教科院等诸多教育专家的合作，通过专业知识反思及长思维链强化学习结合，生成符合教育教学需求的“教学思维链”，提高复杂场景推理的逻辑正确性、专业性、可解释性，并将率先用于教师助手、批改 ...

凤凰网17 小时

DeepSeek打响头炮！国产芯片开打辅助：卷适配、卷落地、卷性价比

昆仑芯科技也表示，理论上，各类大模型的常规模型、常规组网能直接跑通，然而难免会出现特殊算子、特殊规模，需要投入人力进行针对性调试。跑通只是基础，后期涉及后端硬件不同、算子实现不同、对应软件版本不同等因素，精度对齐、性能对齐也都需要人力介入进行针对性适配。

18 小时

更新通知丨语言桥×DTRANX×DeepSeek

除了接入API、ChatUI这两个常规的提示词工程用法，语言桥还会将LanMT与DeepSeek深度融合，打造新一代智能翻译引擎，在保证翻译速度、一致性、稳定性的基础上，探索最优解决方案。除了常规的多语言翻译内容生成，我们还会基于DeepSeek和翻译项目工作流打造更专精的单一任务助手，进一步提升翻译任务的处理效率。

中国能源网19 小时

AI降本有望加速端侧应用和推理算力需求 | 投研报告

我们认为，deepseek系列开源大模型对AI产业发展带来新的启发。大模型可以依靠算法创新而不是算力堆叠来获得高性价比，更低的调用成本将加速AI应用的爆发。端侧AI应用有望加快落地，一方面云服务改善AI使用体验将促进移动端换机，有利于AI手机、眼镜等消费电子上量，另外，蒸馏小模型的本地部署将带动AIPC等换机，端侧SoC和存储芯片等将迎来利好。AI应用的扩大将加大推理端调用规模，推理端算力需求有望 ...

22 小时

巴黎AI峰会热议中国力量：不在场的DeepSeek为何成焦点？

法国总统马克龙在峰会上强调了技术中立性的重要性，呼吁各国根据技术对主权的潜在影响来评估技术，而非单纯依据其来源国。这一立场与美国的霸权心态形成了鲜明对比，进一步凸显了DeepSeek在全球AI格局中的独特地位和价值。

22 小时

OpenAI迎战Deepseek

DeepSeek的崛起标志着全球人工智能竞赛的“转折点”，证明中国可以利用更少的资源与大科技公司竞争。DeepSeek发布的较低成本的开源AI模型爆火，这也让OpenAI重新思考，需要“弄清楚另一种开源战略”。外媒表示，尽管不太可能很快看到OpenA ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果