近日,AI领域掀起了一场关于基准测试结果真实性的风波。争议的焦点集中在埃隆·马斯克旗下的xAI公司最新发布的AI模型Grok 3上。一名OpenAI员工对xAI公司公布的Grok 3在AIME 2025基准测试中的表现提出了质疑,认为其测试结果具有误导性。 xAI公司在其官方博客上发布了一张图表,展示了Grok 3的两个版本——Grok 3 ...