近日,爱德思(Edexcel)官方宣布 国际 A Level 数学(IAL Mathematics) ...
1月20日,月之暗面推出多模态思考模型Kimi k1.5,DeepSeek开源R1推理模型,双双“硬刚”OpenAI。性能测试显示,这两款模型在多项测试中能与o1“叫板”。R1更是得到英伟达高级研究科学家Jim Fan等一众业界大佬的称赞。不过,R1与开源模型V3一样,面临着幻觉问题。
IT之家1 月 17 日消息,阶跃星辰昨日(1 月 16 日)宣布,自研推理模型 Step Reasoner mini(简称 Step R-mini )上线。 官方表示,在 AIME 和 Math 等数学基准测试上,Step Reasoner mini 的成绩超过了 o1-preview,比肩 OpenAI o1-mini。在 LiveCodeBench 代码任务上,也比 o1-preview ...
IT之家1 月 15 日消息,月之暗面今日发布了 Kimi 多模态图片理解模型 API,全新多模态图片理解模型 moonshot-v1-vision-preview(以下简称“Vision 模型”)完善了 moonshot-v1 模型系列的多模态能力。 Vision 模型具备图像识别能力,能够识别出图像中的复杂细节和细微的差别 ...
根据官方分享的数据,讯飞星火X1在中文语境下的小初高、小初高竞赛、大学、大学竞赛等测试集,英文语境下的AIME、MATH 500测试集中,多项指标 ...