中国大模型,正在改写硅谷的价格表。
路透社7月2日报道称,来自中国的公司智谱AI推出GLM-5.2,其编码和代理能力(即只需极少提示即可执行复杂任务的能力)媲美美国领先产品。关键是,成本极低。
美国总统特朗普的前人工智能负责人David Sacks对此表示,“我们现在拥有一个中国的开放权重模型,其性能与当前OpenAI和Anthropic的模型相当。”
中国大模型越来越受关注,背后的一个原因是,不少所谓顶级大模型带来的账单令人咋舌。
《福布斯》曾报道,由于使用Anthropic的Claude代码,Uber公司4个月内,耗尽了2026年全部AI预算。
英国知名IT专业媒体ITPro则报道称,咨询公司埃森哲呼吁员工停止在成本激增中使用AI进行不必要的任务。
当前,AI公司逐步从固定订阅收费转向按使用量计费。在使用方式上,长上下文检索成为常态、简单问答变成多轮推理。无差别使用OpenAI和Anthropic旗舰模型意味着昂贵的账单,更多的科技公司都在寻找降本方案。
美国消费者新闻与商业频道(CNBC)报道,6月,人工智能初创企业Lindy将公司业务全部流量从Anthropic的Claude模型迁移至中国公司深度求索(DeepSeek),因为后者能提供成本更低、参数开源的替代方案。
Lindy首席执行官克里维洛称,这项决定将在数月内为公司节省数百万美元。
这不只是一家科技公司的突然转变。微软CEO萨提亚·纳德拉和美国最大的加密货币交易所Coinbase Global CEO布莱恩·阿姆斯特朗等高管都表示,体量更小、成本更低的模型已经能够满足企业相当一部分需求。
降本诉求驱动更多企业开始推行模型路由机制。这种机制会根据任务难易程度,自动把简单、高频的任务分配给更具价格竞争力的大模型去处理。
在这种趋势下,DeepSeek、阿里通义千问(Qwen)、智谱GLM等中国大模型,被越来越多海外开发者和企业纳入选项。
花旗研报显示,2026年6月OpenRouter平台处理的开源模型Token占比已升至65%,较年初接近翻倍。在6月15日至21日当周,中国AI大模型周调用量18.81万亿Token,连续八周超美国,稳居全球首位。全球前五中,前四均为中国模型。
这意味着,中国大模型开发商正在占据更大的市场。
“中国大模型具备价格竞争力,被更多企业选用将是趋势。”北京华夏工联网智能技术研究院院长王喜文告诉中新经纬,这种成本优势不是省出来、补出来的,而是完整产业体系培育的结果。
作为AI大模型的发动机,算力决定了大模型的吞吐量及速度。受益于“东数西算”布局与规模化基建,中国算力成本大幅降低。正在持续构建的全国一体化算力网平台,预计使训练成本降低25%,推理成本降低10%。
银川算力产业园外貌。(无人机照片)中新社记者 于晶 摄电费则占据AI智算中心运营成本六成以上,中国西部有着廉价且充足的电力。相比之下,硅谷周边不少数据中心正为电网扩容发愁,机房建设成本一路走高。
新疆喀什地区发展新能源产业的优势十分明显,其光伏装机容量连年攀升。中新社记者 田雨昊 摄“还有工程师红利。中国有海量年轻化技术人才,团队迭代速度更快。这意味着,中国团队可以用多条技术路线并行验证等方式,进行低成本试错和高密度研发。”王喜文称。
那么,当企业开始给AI大模型算细账,大家还会过度依赖单一模型吗?
专家们认为,单一模型通吃的时代正在结束。原因并不复杂,没有任何一家厂商能在所有任务维度同时保持最优性能和最低价格。
顶级通用模型固然能力强,但价格摆在那里。轻量化小模型处理简单任务绰绰有余,还有专门深耕代码、推理、长文档等细分领域的专业模型。
“企业AI工具箱里不该只有一把万能锤子,针对不同场景挑选合适工具,才能兼顾成本、稳定性与专业能力。”王喜文称。
除了省钱,多模型策略还有一层更隐蔽的价值,即分散风险。
工业和信息化部信息通信经济专家委员会委员盘和林表示,过度依赖单一供应商,意味着要承受厂商锁定、服务宕机、突然涨价等不确定性风险。多个模型组合应用,可以让科技公司保持对大模型企业的定价优势。
趋势其实已经在发生。当Token消耗只增不减,精打细算才是常态。