文/Leon编辑/cc孙聪颖‍DeepSeek的持续火爆,被广泛认为是中国AI大模型的“弯道超车”,其最大的意义是打破了物理算力至上的逻辑,用更低的成本训练出高性能AI大模型,对行业领头羊OpenAI产生巨大冲击。自2025年1月末上线以来,基于De ...
镰刀跑赢了产业价值作者|速速P而K之编辑丨杨晓鹤DeepSeek到底有多火?今年春节期间,《黑神话:悟空》制作人冯骥盛赞DeepSeek为国运级科技成果,让DeepSeek破圈传播,截至发稿前,热搜话题不下于30个。不仅如此,DeepSeek还创造了 ...
李飞飞用50美元训练出和deepseek水平一样的大模型,讽刺DEEPSEEK抄袭,英伟达市值不久会突破历史新高 AI教母”李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练出一个名为S1的人工智能推理模型,其数学和编码能力在测试中的表现达到了OpenAI o1和DeepSeek R1的水平。 需要指出的是,S1模型是使用了16个英伟达H100显卡、通过数据蒸馏谷歌Gemini 2.
最近,科技界的目光聚焦在了DeepSeek身上。这个项目被指拥有高达5万张英伟达H100显卡,听起来简直就像科幻电影里的情节。对此,特斯拉和SpaceX的创始人马斯克幽默地评论道:“明显是!”他显然对这个数字半信半疑。
近日,知名分析师郭明錤发文指出,随着DeepSeek的快速崛起,端侧AI技术的发展趋势将被进一步加速。特别是在人工智能领域,DeepSeek不仅为训练需求注入了活力,还重新点燃了开发者对本地部署大语言模型(LLM)的热情。这一现象,为未来科技行业的发 ...
DeepSeek在一份技术报告中称,它使用超过2000个英伟达H800芯片集群来训练其参数为6710亿的V3模型,而Meta训练参数量4050亿的Llama3,用了16384块更强的H100显卡,花了54天。Deepseek的训练效率为Meta的11 ...
随后,他在麻省理工学院学习计算机科学,但中途退学,创办了Scale AI,成了硅谷的AI神童。 Alexandr说:Deep Seek至少有5万张英伟达H100显卡,只不过因为制裁的原因,不方便说而已。事后,我看了好几遍CNBC电视台的采访,他的原话是as my understanding,也就是“按照 ...
2月7日,软银敲定400亿美元对OpenAI的首轮投资,此次融资的部分资金或将用于兑现OpenAI对“星际之门”项目的承诺,首笔资金最快将于春季到位。届时,软银也将超越微软,成为OpenAI的最大投资方。1月21日,美国总统特朗普在白宫宣布了“星际之 ...
近日,美国人工智能数据基础公司Scale AI创始人兼首席执行官Alexandr Wang在接受CNBC采访时称,DeepSeek拥有大约五万块英伟达H100芯片,但因美国出口管制措施,他们不能公开谈论。 王在采访中先夸赞了DeepSeek的性能称, ...
DeepSeek创始人梁文锋最早开启AI研究的初衷是,用GPU计算交易仓位,训练量化交易模型。此后,出于探索AI能力边界的好奇,他们囤积了过万块先进GPU芯片开始训练AGI模型,储备量接近国内一线互联网公司,高于大模型创业六小龙。这为DeepSeek ...