DeepSeek打破了中国AI企业在大模型领域长期以来扮演的追随者形象,于1月26日同时登顶苹果App Store和谷歌Play Store全球下载榜首,上线18天,累计下载量突破1600万次,在覆盖的140个市场中持续保持领先地位。DeepSeek表示,训练其最新模型之一的成本则为560万美元(约合人民币4100万元),与此同时,谷歌Gemini Ultra模型的训练成本则为1.91亿美元。
文/Leon编辑/cc孙聪颖‍DeepSeek的持续火爆,被广泛认为是中国AI大模型的“弯道超车”,其最大的意义是打破了物理算力至上的逻辑,用更低的成本训练出高性能AI大模型,对行业领头羊OpenAI产生巨大冲击。自2025年1月末上线以来,基于De ...
近日,美国人工智能数据基础公司Scale AI创始人兼首席执行官Alexandr Wang在接受CNBC采访时称,DeepSeek拥有大约五万块英伟达H100芯片,但因美国出口管制措施,他们不能公开谈论。 王在采访中先夸赞了DeepSeek的性能称,“我们发现,DeepSeek(R1)是目前表现最好的,或者说与美国最好的模型(GPT o1)处于同一水平。” 当被问及中美两国在人工智能领域的竞争时, ...
最近,科技界的目光聚焦在了DeepSeek身上。这个项目被指拥有高达5万张英伟达H100显卡,听起来简直就像科幻电影里的情节。对此,特斯拉和SpaceX的创始人马斯克幽默地评论道:“明显是!”他显然对这个数字半信半疑。
两年前,老美的一纸禁令,让英伟达A100和H100芯片对我国AI企业的供应彻底中断。这本来是想精准打击我们的“算力”,但没想到,却意外地点燃了我国AI产业的熊熊大火。一时间,从华为昇腾芯片站出来扛起训练的大旗,到摩尔线程用国产GPU来解决推理的难题,一场轰轰烈烈的“去英伟达化”技术革命就这样开始了。 就在2月4日,摩尔线程的一则官方宣布让整个行业都炸了锅。这意味着,继华为之后,又一家中国企业打破了 ...
不仅如此,DeepSeek还创造了许多记录。据QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后7天狂揽1亿用户,超越ChatGPT的用户增长速度,成为史上用户数增长最快的互联网产品。
2月7日,软银敲定400亿美元对OpenAI的首轮投资,此次融资的部分资金或将用于兑现OpenAI对“星际之门”项目的承诺,首笔资金最快将于春季到位。届时,软银也将超越微软,成为OpenAI的最大投资方。
随后,他在麻省理工学院学习计算机科学,但中途退学,创办了Scale AI,成了硅谷的AI神童。 Alexandr说:Deep Seek至少有5万张英伟达H100显卡,只不过因为制裁的原因,不方便说而已。事后,我看了好几遍CNBC电视台的采访,他的原话是as my understanding,也就是“按照 ...
李飞飞用50美元训练出和deepseek水平一样的大模型,讽刺DEEPSEEK抄袭,英伟达市值不久会突破历史新高 AI教母”李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练出一个名为S1的人工智能推理模型,其数学和编码能力在测试中的表现达到了OpenAI o1和DeepSeek R1的水平。 需要指出的是,S1模型是使用了16个英伟达H100显卡、通过数据蒸馏谷歌Gemini 2.
用了16384块更强的H100显卡,花了54天。Deepseek的训练效率为Meta的11倍。 DeepSeek表示,训练其最新模型之一的成本为560万美元(约合人民币4100万元)。