前段时间,来自斯坦福团队研究人员通过多智能体强化学习(multi-agent RL),训练LLM掌握战略性社交推理,结果发现,使胜率比标准强化学习提升一倍。
近日,FerretDB宣布推出2.0版本的首个候选发布版,作为MongoDB的开源替代方案,这款数据库工具带来了显著的性能提升和功能增强。FerretDB由新近发布的DocumentDB驱动,支持向量搜索和复制,性能与市场领先产品相当,某些工作负载处 ...
在训练步骤约680步时,模型的训练奖励值、反思能力和回答长度同时出现显著提升,疑似出现了DeepSeek-R1-Zero论文中类似的“顿悟时刻” (aha moment) 。
谷歌团队发布LLM硬核技术教科书,从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。 由于深度学习的「黑箱」本性,从业者自我调侃道: ...
DeepSeek 刚刚公开了他们的"秘密武器"是如何打造的!这事儿有多火?他们就放出了一个 GitHub ...
近日,FerretDB团队宣布推出其2.0版本的首个候选发布版,标志着作为MongoDB开源替代方案的重要进展。FerretDB的联合创始人兼首席执行官彼得·法尔卡斯(Peter ...
姜东志 投稿量子位 | 公众号 QbitAI OpenAI o1和DeepSeek-R1靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?
【微软CEO纳德拉:DeepSeek有“真创新” AI成本下降是趋势 DeepSeek将接入微软AI电脑】 微软CEO纳德拉在电话会上强调,DeepSeek-R1模型目前已可通过微软的AI平台Azure AI Foundry和GitHub获取,并且很快就能在Copilot+电脑上运行。纳德拉称DeepSeek“有一些真的创新”,AI成本下降是趋势:“缩放定律(Scaling Law)在预训练和推理 ...
北京时间 2 月 18 日中午,埃隆·马斯克旗下的人工智能公司 xAI 重磅发布了 Grok 3 系列模型,宣称其在数学、科学和编码基准测试中,击败了 Google Gemini、DeepSeek V3、Claude 以及 OpenAI 的 ...
居家办公时需要访问公司电脑、给远方年迈父母解决电脑故障、帮助同事处理技术问题,这些都是我们经常需要遇到的远程场景。 然而,现有的远程工具要么配置复杂,要么数据不安全,要么价格昂贵。这些问题一直困扰着我们,让远程协作变得麻烦。 最近在 GitHub 上,我发现了一款开源的远程桌面工具:RustDesk,完全免费、功能强大,最重要的是,使用起来特别简单! RustDesk软件下载地址:https:// ...
黄锴宇 投稿至 凹非寺量子位 | 公众号 QbitAI 一个眼神锁定你!多模态视觉定位能力升级—— 由单张图像拓展至多图像应用场景。 比如,在复杂的相册中自动识别出Luigi并在第二张图中找到他,或是根据钢铁侠剧照自动在合影中找到对应的演员唐尼。 Q:Image-1 is the photo album of someone in Image-2, please find and locate t ...