【太平洋科技快讯】3 月 30 日,评测机构ClawBench 发布了最新大型模型榜单。北京人工智能企业智谱、字节、小米共有 4 款模型跻身全球前十。
榜单显示,智谱 GLM-5-Turbo 以 93.9 分获得全球第一;字节跳动旗下豆包模型 Doubao-Seed-2.0-lite 位列全球第二,同时在全榜单中使用成本最低;小米 MiMo-V2 系列两款模型成功上榜,其中 MiMo-V2-Omni 位列第九,在运行速度上表现领先。
今日,小米方面透露,MiMo-V2-Pro 在复杂逻辑推理、长指令遵循、多轮对话稳定性等维度表现稳健,在 Model Rank 排名中位居全球第五。在反映实验室综合研发能力的 LabRank 体系中,小米在 Text Arena(ArenaExpert)位列全球第四,Code Arena 位列全球第五,综合实力仅次于 Anthropic、OpenAI 与谷歌。
据介绍,ClawBench 关联的 Text Arena 榜单采用双盲测试机制,在隐藏模型身份的前提下,由全球真实用户依据回答质量直接投票,有效避免针对数据集优化的 “刷榜” 现象,评测结果更贴近实际使用体验。