宣称从0构建，印度AI实验室Sarvam发布两款MoE架构LLM_商业

创始人

2026-02-21 00:04:19

0次

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

（来源：IT之家）

IT之家 2 月 20 日消息，印度 AI 实验室 Sarvam 当地时间本月 18 日在印度人工智能影响力峰会上发布了 2 款“从 0 构建”的最新一代 MoE 架构大语言模型。这两款模型即将在 Hugging Face 上以开源权重的形式提供，API 访问和仪表盘支持也将随后推出。

Sarvam 两款新模型中的较小型号采用 30B-A1B 设计，预训练数据集规模达 16T，支持 32K 上下文窗口，面向需求低延迟的实时应用场景；规模较大的型号则采用 105B-A9B 设计，支持 128K 上下文窗口，面向要求更为严苛的用例。

Sarvam 宣称其 105B-A9B 模型在本地化的印度语言基准测试中优于谷歌 Gemini 2.5 Flash 等竞争对手。而对于更广泛的工作负载，其“大多数基准测试中优于 DeepSeek R1，许多基准测试中优于谷歌 Gemini Flash”。

长征五号B遥一运载火箭顺利通过... 2020年1月19日，长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...

9所本科高校获教育部批准 6所... 1月19日，教育部官方网站发布了关于批准设置本科高等学校的函件，9所由省级人民政府申报设置的本科高等...

湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息：经湖北省纪委监委审查调查，黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...

《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯今天下午，《大江大河2》剧组发布公告，称当前防控疫情是重中之重的任务，为了避免剧组工作人...

泰国官方：已确诊8例新型冠状病...

芬兰国家旅游局致信中国游客：芬...

中国驻悉尼总领馆通报新南威尔士...

印尼巴布亚索隆发现1名疑似新型...

美国确诊第3例新型冠状病毒患者...

中国驻葡萄牙使馆关于葡萄牙出现...

中国驻苏丹大使馆微信公众号开通...

中国驻苏丹大使馆给大家拜年啦 ...

泰国已确诊8例新型冠状病毒肺炎...

快讯！日本确诊第4例新冠肺炎病...

日本10万人在线看春晚，屏幕刷...

安倍晋三：将与中国政府协调，派...

全球加紧研发新型冠状病毒疫苗和...

中国驻肯尼亚大使馆提醒侨胞做好...

伊朗称其浓缩铀储量已超1200...