两年前,老美的一纸禁令,让英伟达A100和H100芯片对我国AI企业的供应彻底中断。这本来是想精准打击我们的“算力”,但没想到,却意外地点燃了我国AI产业的熊熊大火。一时间,从华为昇腾芯片站出来扛起训练的大旗,到摩尔线程用国产GPU来解决推理的难题,一场轰轰烈烈的“去英伟达化”技术革命就这样开始了。 就在2月4日,摩尔线程的一则官方宣布让整个行业都炸了锅。这意味着,继华为之后,又一家中国企业打破了 ...
近日,知名分析师郭明錤发文指出,随着DeepSeek的快速崛起,端侧AI技术的发展趋势将被进一步加速。特别是在人工智能领域,DeepSeek不仅为训练需求注入了活力,还重新点燃了开发者对本地部署大语言模型(LLM)的热情。这一现象,为未来科技行业的发 ...
李飞飞用50美元训练出和deepseek水平一样的大模型,讽刺DEEPSEEK抄袭,英伟达市值不久会突破历史新高 AI教母”李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练出一个名为S1的人工智能推理模型,其数学和编码能力在测试中的表现达到了OpenAI o1和DeepSeek R1的水平。 需要指出的是,S1模型是使用了16个英伟达H100显卡、通过数据蒸馏谷歌Gemini 2.
“DeepSeek冲击”余威仍在,近日,“AI教母”李飞飞团队推出的AI推理模型s1,在数学和编程测试中,与OpenAI o1和DeepSeek R1不分伯仲,更关键是训练成本仅50美元。如此低成本的推理模型,再度引发了业内讨论。
1957年,苏联抢在美国前面发射了全球第一颗人造卫星“斯普特尼克1号”,宣告人类进入太空时代。 西方媒体给这个时间点起了个名,叫“斯普特尼克时刻”。(Sputnik Moment) 这当然不是为了纪念人类文明的关键一步,而是为了表达美国在航天领域被对手超越的焦虑。 该词后来泛指美国在科技竞争中“被超车”的“压力时刻”。 不过这些都跟当时的中国没啥关系。 在那个年代,中国老百姓手头最要紧的事是种田, ...
斯坦福和华盛顿大学的研究人员开发出一种新的大语言模型s1-32B,在某些任务上表现优于OpenAI的o1-preview,但成本仅为后者的一小部分。该模型采用测试时计算技术,通过增加生成答案的时间和硬件资源来提升输出质量。s1-32B在数学基准测试中 ...
文/Leon编辑/cc孙聪颖‍DeepSeek的持续火爆,被广泛认为是中国AI大模型的“弯道超车”,其最大的意义是打破了物理算力至上的逻辑,用更低的成本训练出高性能AI大模型,对行业领头羊OpenAI产生巨大冲击。自2025年1月末上线以来,基于De ...
智通财经APP获悉,中信建投发布研报称,DeepSeek-R1可通过Ollama工具实现本地部署,首先从Ollama官网下载适合Windows系统的版本并安装,选择合适的模型版本 (如RTX 4090推荐32B),并通过命令行运行。为提升用户体验,可使用Docker+Open WebUI构建交互界面,甚至集成到微信作为智能体使用。
从另一方面看,英伟达股价的大幅下跌恰恰而言折射出的是在经受DeepSeek风暴冲击下其AI芯片霸权的逐渐被终结。正如塔勒布现任对冲基金Universa ...
当然不可以,土豪的话当我没讲 自从 Deepseek-r1 爆火,B站上就爆出了一大批视频,教学 r1 模型的本地部署,不限配置,但是呢,稍微动脑想想,这都是不可能的,为什么大家会有如此的概念,感觉自己部署的就是 r1 呢?可能是来自于 Ollama ...
DeepSeek大模型的出色表现引发美国AI行业上下震动,不仅性能与OpenAI O1旗鼓相当,更关键的是训练成本低得多,也引发了美国政府的猜疑和调查,新加坡都被牵扯进来。