DeepSeek打破了中国AI企业在大模型领域长期以来扮演的追随者形象,于1月26日同时登顶苹果App Store和谷歌Play Store全球下载榜首,上线18天,累计下载量突破1600万次,在覆盖的140个市场中持续保持领先地位。DeepSeek表示,训练其最新模型之一的成本则为560万美元(约合人民币4100万元),与此同时,谷歌Gemini Ultra模型的训练成本则为1.91亿美元。
两年前,老美的一纸禁令,让英伟达A100和H100芯片对我国AI企业的供应彻底中断。这本来是想精准打击我们的“算力”,但没想到,却意外地点燃了我国AI产业的熊熊大火。一时间,从华为昇腾芯片站出来扛起训练的大旗,到摩尔线程用国产GPU来解决推理的难题,一场轰轰烈烈的“去英伟达化”技术革命就这样开始了。 就在2月4日,摩尔线程的一则官方宣布让整个行业都炸了锅。这意味着,继华为之后,又一家中国企业打破了 ...
李飞飞用50美元训练出和deepseek水平一样的大模型,讽刺DEEPSEEK抄袭,英伟达市值不久会突破历史新高 AI教母”李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练出一个名为S1的人工智能推理模型,其数学和编码能力在测试中的表现达到了OpenAI o1和DeepSeek R1的水平。 需要指出的是,S1模型是使用了16个英伟达H100显卡、通过数据蒸馏谷歌Gemini 2.
1957年,苏联抢在美国前面发射了全球第一颗人造卫星“斯普特尼克1号”,宣告人类进入太空时代。 西方媒体给这个时间点起了个名,叫“斯普特尼克时刻”。(Sputnik Moment) 这当然不是为了纪念人类文明的关键一步,而是为了表达美国在航天领域被对手超越的焦虑。 该词后来泛指美国在科技竞争中“被超车”的“压力时刻”。 不过这些都跟当时的中国没啥关系。 在那个年代,中国老百姓手头最要紧的事是种田, ...
文/Leon编辑/cc孙聪颖DeepSeek的持续火爆,被广泛认为是中国AI大模型的“弯道超车”,其最大的意义是打破了物理算力至上的逻辑,用更低的成本训练出高性能AI大模型,对行业领头羊OpenAI产生巨大冲击。自2025年1月末上线以来,基于De ...
从另一方面看,英伟达股价的大幅下跌恰恰而言折射出的是在经受DeepSeek风暴冲击下其AI芯片霸权的逐渐被终结。正如塔勒布现任对冲基金Universa ...
6 天
来自MSNDeepSeek R1 我可以进行本地部署吗?当然不可以,土豪的话当我没讲 自从 Deepseek-r1 爆火,B站上就爆出了一大批视频,教学 r1 模型的本地部署,不限配置,但是呢,稍微动脑想想,这都是不可能的,为什么大家会有如此的概念,感觉自己部署的就是 r1 呢?可能是来自于 Ollama ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果