ClawBench大模型榜单发布:小米字节等四款模型跻身全球前十
创始人
2026-03-31 23:55:31
0

【太平洋科技快讯】3 月 30 日,评测机构ClawBench 发布了最新大型模型榜单。北京人工智能企业智谱、字节、小米共有 4 款模型跻身全球前十。

榜单显示,智谱 GLM-5-Turbo 以 93.9 分获得全球第一;字节跳动旗下豆包模型 Doubao-Seed-2.0-lite 位列全球第二,同时在全榜单中使用成本最低;小米 MiMo-V2 系列两款模型成功上榜,其中 MiMo-V2-Omni 位列第九,在运行速度上表现领先。

今日,小米方面透露,MiMo-V2-Pro 在复杂逻辑推理、长指令遵循、多轮对话稳定性等维度表现稳健,在 Model Rank 排名中位居全球第五。在反映实验室综合研发能力的 LabRank 体系中,小米在 Text Arena(ArenaExpert)位列全球第四,Code Arena 位列全球第五,综合实力仅次于 Anthropic、OpenAI 与谷歌。

据介绍,ClawBench 关联的 Text Arena 榜单采用双盲测试机制,在隐藏模型身份的前提下,由全球真实用户依据回答质量直接投票,有效避免针对数据集优化的 “刷榜” 现象,评测结果更贴近实际使用体验。

相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...