GitHub Pro - 搜索 News

幻觉问题仍是挑战：大多数受测模型的错误率（IN）高于不尝试回答的比率（NA），这表明模型更倾向于自信地提供错误信息。幻觉问题仍是多模态大模型领域的一个重要挑战。

来自MSN5 小时

相信不少同学都用过 Notion 这款笔记软件，它凭借着集知识库、笔记、任务看板等多功能于一体的设计，已经成为了许多互联网用户的首选工具。但作为程序员的我们总是有着更多的期待，比如更好的隐私保护、更自由的部署方式、更开放的生态系统。在 ...

点击上方“Deephub Imba”,关注公众号,好文章不错过 !SmolLM2 采用创新的四阶段训练策略，在仅使用 1.7B 参数的情况下，成功挑战了大型语言模型的性能边界：在 MMLU-Pro 等测试中超越 Qwen2.5-1.5B 近 6 ...

23 小时

在AI领域，近日一项引人注目的研究揭示出一种全新的训练方法，能够在仅仅1/30的训练步骤下，复刻DeepSeek-R1-Zero的性能。这项由一众AI大咖，如沈向洋、姜大昕和张祥雨等人共同推出的开源模型——OpenReasonerZero（ORZ），在国内大模型竞赛中，引起了广泛关注。

16 小时

北京时间 2 月 18 日中午，埃隆·马斯克旗下的人工智能公司 xAI 重磅发布了 Grok 3 系列模型，宣称其在数学、科学和编码基准测试中，击败了 Google Gemini、DeepSeek V3、Claude 以及 OpenAI 的 ...

一些您可能无法访问的结果已被隐去。