当硅谷企业也烧不起Token，中国大模型成新选项_商业

创始人

2026-07-04 15:48:20

0次

中国大模型，正在改写硅谷的价格表。

路透社7月2日报道称，来自中国的公司智谱AI推出GLM-5.2，其编码和代理能力（即只需极少提示即可执行复杂任务的能力）媲美美国领先产品。关键是，成本极低。

美国总统特朗普的前人工智能负责人David Sacks对此表示，“我们现在拥有一个中国的开放权重模型，其性能与当前OpenAI和Anthropic的模型相当。”

中国大模型越来越受关注，背后的一个原因是，不少所谓顶级大模型带来的账单令人咋舌。

《福布斯》曾报道，由于使用Anthropic的Claude代码，Uber公司4个月内，耗尽了2026年全部AI预算。

英国知名IT专业媒体ITPro则报道称，咨询公司埃森哲呼吁员工停止在成本激增中使用AI进行不必要的任务。

当前，AI公司逐步从固定订阅收费转向按使用量计费。在使用方式上，长上下文检索成为常态、简单问答变成多轮推理。无差别使用OpenAI和Anthropic旗舰模型意味着昂贵的账单，更多的科技公司都在寻找降本方案。

美国消费者新闻与商业频道(CNBC)报道，6月，人工智能初创企业Lindy将公司业务全部流量从Anthropic的Claude模型迁移至中国公司深度求索（DeepSeek），因为后者能提供成本更低、参数开源的替代方案。

Lindy首席执行官克里维洛称，这项决定将在数月内为公司节省数百万美元。

这不只是一家科技公司的突然转变。微软CEO萨提亚·纳德拉和美国最大的加密货币交易所Coinbase Global CEO布莱恩·阿姆斯特朗等高管都表示，体量更小、成本更低的模型已经能够满足企业相当一部分需求。

降本诉求驱动更多企业开始推行模型路由机制。这种机制会根据任务难易程度，自动把简单、高频的任务分配给更具价格竞争力的大模型去处理。

在这种趋势下，DeepSeek、阿里通义千问（Qwen）、智谱GLM等中国大模型，被越来越多海外开发者和企业纳入选项。

花旗研报显示，2026年6月OpenRouter平台处理的开源模型Token占比已升至65%，较年初接近翻倍。在6月15日至21日当周，中国AI大模型周调用量18.81万亿Token，连续八周超美国，稳居全球首位。全球前五中，前四均为中国模型。

这意味着，中国大模型开发商正在占据更大的市场。

“中国大模型具备价格竞争力，被更多企业选用将是趋势。”北京华夏工联网智能技术研究院院长王喜文告诉中新经纬，这种成本优势不是省出来、补出来的，而是完整产业体系培育的结果。

作为AI大模型的发动机，算力决定了大模型的吞吐量及速度。受益于“东数西算”布局与规模化基建，中国算力成本大幅降低。正在持续构建的全国一体化算力网平台，预计使训练成本降低25%，推理成本降低10%。

银川算力产业园外貌。(无人机照片)中新社记者于晶摄

电费则占据AI智算中心运营成本六成以上，中国西部有着廉价且充足的电力。相比之下，硅谷周边不少数据中心正为电网扩容发愁，机房建设成本一路走高。

新疆喀什地区发展新能源产业的优势十分明显，其光伏装机容量连年攀升。中新社记者田雨昊摄

“还有工程师红利。中国有海量年轻化技术人才，团队迭代速度更快。这意味着，中国团队可以用多条技术路线并行验证等方式，进行低成本试错和高密度研发。”王喜文称。

那么，当企业开始给AI大模型算细账，大家还会过度依赖单一模型吗？

专家们认为，单一模型通吃的时代正在结束。原因并不复杂，没有任何一家厂商能在所有任务维度同时保持最优性能和最低价格。

顶级通用模型固然能力强，但价格摆在那里。轻量化小模型处理简单任务绰绰有余，还有专门深耕代码、推理、长文档等细分领域的专业模型。

“企业AI工具箱里不该只有一把万能锤子，针对不同场景挑选合适工具，才能兼顾成本、稳定性与专业能力。”王喜文称。

除了省钱，多模型策略还有一层更隐蔽的价值，即分散风险。

工业和信息化部信息通信经济专家委员会委员盘和林表示，过度依赖单一供应商，意味着要承受厂商锁定、服务宕机、突然涨价等不确定性风险。多个模型组合应用，可以让科技公司保持对大模型企业的定价优势。

趋势其实已经在发生。当Token消耗只增不减，精打细算才是常态。