2月4日凌晨,Chatbot Arena LLM Leaderboard更新的最新一期榜单中,对标DeepSeek-V3的阿里云Qwen2.5-Max首次进入全球前十,超越DeepSeek-V3、o1-mini和Claude-3.5-Sonnet等 ...
来自阿里,Qwen2.5-Max,超越了DeepSeek-V3,以总分1332的成绩位列总榜第七。 同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。 特别是在编程、数学等 ...
2月4日凌晨,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,一周前刚发布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果