2月10日,清华KVCache.AI团队联合趋境科技发布KTransformers开源项目更新,支持24G显存在本地运行DeepSeek-R1、V3的671B“满血版”。更新发布后,不少开发者测试发现,显存消耗比技术文档中提到的还要少,实际内存占用约 ...
在训练框架上,Deepseek-V3团队打造了HAI-LLM框架,并进行了细致的工程优化。首先是设计了DualPipe(双管道)算法以实现高效的管道并行,并实现了计算和通信重叠(而不是按照串行模式,完成计算再进行通信),从而解决了跨节点专家并行带来的 ...
DeepSeek的崛起标志着全球人工智能竞赛的“转折点”,证明中国可以利用更少的资源与大科技公司竞争。DeepSeek发布的较低成本的开源AI模型爆火,这也让OpenAI重新思考,需要“弄清楚另一种开源战略”。外媒表示,尽管不太可能很快看到OpenA ...
2024年中芯国际的资本开支约为73.3亿美元(约500亿元人民币),与2023年持平。2025年资本开支预计也将与2024年持平,表明中芯国际的扩产步伐没有放缓。 资本开支的持续高水平预示着半导体设备、材料等上下游供应链的需求仍然强劲。特别是半导体设备和材料公司,如 北方华创 、 中微公司 、 南大光电 、 彤程新材 等,受益于这一趋势,未来可能会迎来业绩的改善。
DeepSeek R1 主要分为两大类别,共计 8 个版本,但性能与 GPT - o1 抗衡的版本只有 671B 满血版本。其他蒸馏版模型虽经过了调优,但性能仍与满血版有差距。然而,根据传统的私有化部署方案,运行 671B 参数的大模型需组建H100 ...
2月12日,华为云突然甩出一张“技术底牌”:DeepSeek V3/R1“满血版”大模型正式上线。 消息一出,有人高呼“国产算力终于站起来了”,也有人质疑“对标国际巨头是不是吹牛”。但无论如何,这一次,实力藏不住了。
在中国新兴企业DeepSeek宣布以低成本开发出AI模型的消息后,人们对图形处理器(GPU)的价格产生了浓厚的兴趣。分析师指出,DeepSeek所采用的美国英伟达(NVIDIA)的GPU市场价格比美国同行所使用的尖端产品低了10%到30%。这种价格虽然没有极端便宜,但却值得我们关注。
近期,中国AI企业DeepSeek以低成本开发出对标美国OpenAI的AI模型,引发了行业对GPU价格的关注。据分析,DeepSeek使用的英伟达H800芯片价格比美国企业常用的H100便宜约1至3成。H800相当于H100的降级版,计算速度仅为其一 ...
TechWeb 文/ 果青题图/ 豆包AI2月6日,据国内AI产品榜 aicpb.com数据,DeepSeek 应用(APP) 2025/01/11 日发布,截止 1/31 日上线仅 21 天。日活跃用户DAU ...
摩根士丹利此前对中国股市持低配的观点,原因是出于对贸易关税、盈利下行等不确定性的担忧。但该机构最新发布的报告已有所改观。“目前投资者逐步认识到,中国的AI发展可能不需要大规模资本投入,即便高端GPU供应受限,仍然具备缩小甚至弥合技术差距的能力。中美竞 ...
【洞见·TMT】 ...
当下,人工智能蓬勃发展,创新技术不断涌出, 整个行业正经历着一场意义深远的变革。 而这其中,DeepSeek 和 LPU 的出现格外引人注目。DeepSeek 凭借其卓越的性能和强大的成本优势,迅速在全球范围内圈粉无数,掀起了一股使用热潮。而LPU,作为专为语言处理任务量身定制的硬件处理器,以其区别于传统 GPU 的创新架构、令人惊叹的性能表现和超低的成本优势,成为了 AI 领域的新宠。 Deep ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果