DeepSeek似乎在极短的时间内,以极低的成本实现了与世界顶级大语言模型(LLM)相当甚至更优的性能。这一成果令投资者开始质疑美国是否能够仅通过在晶片上花费数千亿美元来维持在人工智能领域的领先地位。
一周前,芯东西发表了《创历史!DeepSeek获16大国产AI芯片力挺,中国智算的半壁江山都出动了》报道,承蒙厚爱,文内统计数据被很多文章照搬,但也有一些文章添枝加叶地把龙芯算进去、改成“17大国产AI芯片”,给读者朋友们辟个谣:龙芯不是AI芯片公司 ...
IT之家 2 月 15 日消息,现阶段用户使用 DeepSeek-R1 的主要途径无外乎云服务及“本地部署”,但官网服务器频频宕机、个人部署多为参数量缩水 90% 的蒸馏版。因此,一般用户要想在普通硬件上运行起真正的 DeepSeek-R1 满血版可以说很难很难,而租赁服务器的成本就算是开发者也倍感压力。
在训练框架上,Deepseek-V3团队打造了HAI-LLM框架,并进行了细致的工程优化。首先是设计了DualPipe(双管道)算法以实现高效的管道并行,并实现了计算和通信重叠(而不是按照串行模式,完成计算再进行通信),从而解决了跨节点专家并行带来的 ...
19 小时
来自MSN百度谭待回击沈抖:大模型价格战背后,云厂商的真实焦虑何在?在科技界的聚光灯下,一场围绕人工智能大模型价格战的争论悄然上演,主角是百度智能云事业群总裁沈抖与火山引擎总裁谭待,两位均出身于百度,却在新的舞台上针锋相对。
【下周一科创综指ETF集体发售 人工智能ETF年内最高涨超20% “硬科技”后市仍可期】作为资金支持“硬科技”产业的重要渠道,科创板ETF产品管理规模超过3000亿,较2023年末增长60%。值得注意的是,18只科创综指ETF即将迎来发售,已有多家基金公司定档发售时间为2月17日,即下周一。
DeepSeek出现之前,不少教育公司已通过自研模型、寻求合作等方式进行探索,积累了一定的“先发优势”。然而,在引入成本更低、效率更高的DeepSeek后,是否还有必要保留自研模型?要如何处理二者之间关系?
据介绍,本次测评工作旨在为DeepSeek系列模型在多硬件多场景下的适配部署提供参考。一是评价模型在包括硬件芯片、计算设备、智算集群等软硬件系统中的适配效果;二是反映模型在软硬件系统适配过程中软件栈及工具的适配易用性及开发部署成本。
36氪获悉,华数传媒发布公告,目前由公司运营与研发的“诗画浙江文旅惠民卡”(简称“文旅卡”)产品上线了与DeepSeek融合的艾珈智行助手,文旅宣推官艾珈可为用户提供个性化智能服务,是对文旅卡产品功能的优化,对公司业务收益无直接实质性影响。目前文旅卡销量超16万张,终端售价为199元/张,未对公司业绩产生重大影响。
随着全球范围内智算中心的如雨后春笋般涌现,人工智能领域正掀起一场激烈的“高地争夺战”。DeepSeek-V3的问世,一度让业界预言“算力需求将大幅缩减”与“AI预训练时代或将落幕”。这些预测背后的原因,在于多数高性能模型作为闭源产品,被紧紧绑定在特定厂商平台上,导致拥有丰富算力资源的企业难以低成本整合顶尖大模型能力,进而使得智算中心面临应用不足的尴尬境地。
2月14日,软件指数盘中活跃,盘中一度涨超3%。相关ETF方面, 软件ETF基金(561010)盘中涨3% ,今年以来(1月2日—2月13日)涨超17%。成分股方面,嘉和美康涨停,新致软件、创业慧康、深信服等多股跟涨。
2024年中芯国际的资本开支约为73.3亿美元(约500亿元人民币),与2023年持平。2025年资本开支预计也将与2024年持平,表明中芯国际的扩产步伐没有放缓。 资本开支的持续高水平预示着半导体设备、材料等上下游供应链的需求仍然强劲。特别是半导体设备和材料公司,如北方华创、中微公司、南大光电、彤程新材等,受益于这一趋势,未来可能会迎来业绩的改善。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果