AI热潮中,一个概念的地位正在渐渐凸显——Token。
近日,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。这也从官方层面明确了Token的中文翻译——词元。
日均调用量突破140万亿
一组数据直观反映出词元的增长速度:
2024年初,
我国日均词元调用量为1000亿; 到2025年底,
跃升至100万亿; 今年3月,
已突破140万亿。
两年时间,增长超千倍。
与此同时,今年1月底以来,有模型企业创下20天收入超过2025年全年总收入的业绩纪录。这组数据背后,是一套以词元计费为基础的新型商业逻辑正在加速演进。
词元是什么?
从定义上看,词元是大模型处理语言时使用的基本单位,也是处理信息的最小单元。
理解这一概念,需要先明确一个基本逻辑:在与大模型的交互中,模型不会像人那样“直接读懂一句话”,而是先将一段语言进行拆分,再把这些拆分后的部分转化为数字,经过计算后再还原为文字。
例如,“科技正在改变世界”,在模型中会被拆分为“科技”“正在”“改变”“世界”等部分,经历“切分语言—映射编号—进行计算—生成新编号—再还原为文字”的过程。
从这个角度看,文字是人们看到的外在形式,词元才是模型实际处理信息的内部形态。通常情况下,中文一个字对应1至2个词元,每一次提问和模型生成的回答,都会消耗一定数量的词元。
因此,词元的调用量,成为衡量大模型使用情况的基础指标之一。
“养龙虾”带火词元
近期,一股“养龙虾”热潮,让词元这一概念进入大众视野。
随着各类智能体(Agent)应用不断涌现,重度任务和开发需求增加,词元使用量迅速提升,相关费用也逐渐显现。
国家超算互联网启动新一轮词元赠送活动,面向平台用户限时免费发放单人最高3000万词元额度,以降低智能体应用体验门槛,同时推出0.1元/百万Tokens的特惠续用价格,将延至4月6日。
不只是技术单位,更是“结算单位”
词元既是大模型处理信息的最小单位,也是AI服务的计费基础单位。
围绕词元的调用、分发与结算,一套新的价值体系正在加速形成。词元具有可计量、可定价、可交易的特征,使智能服务能够被量化,并成为人工智能产业商业化的重要路径。
同时,词元也是数据、算法、算力三大核心要素在运行过程中的基础单位,贯穿大模型从数据处理到结果生成的全过程。
词元为何出现“大爆炸”?
词元调用量的快速增长,与人工智能发展多方面因素相关。
一、人工智能加速落地
“人工智能+”持续推进,应用场景不断拓展。
2025年,我国人工智能核心产业规模超过1.2万亿元,企业数量超过6200家,中国企业推出的开源大模型下载量位居全球第一。相关企业业绩增长保持加速度,一些模型企业实现短时间内收入快速提升。
在具体应用层面,从图像生成、视频生成,到内容创作等领域,AI的应用频率和广度不断扩大。
二、电力与算力支撑能力增强
AI发展带动电力需求持续增长。
截至2025年底,我国发电总装机容量达到38.9亿千瓦,预计2026年底将突破43亿千瓦;全社会用电量超过10万亿千瓦时。
“十四五”时期,我国建成全球最大、发展最快的可再生能源体系,可再生能源装机占比由40%提升至60%左右。与此同时,“算电协同”成为中国新基建战略中的核心概念,2026年首次被写入政府工作报告。
三、“人工智能+”赋能千行百业
我国拥有完整工业体系和丰富数据资源,“人工智能+”正加速与各行业融合。
这一过程推动AI应用不断深化,也带动词元调用规模持续增长,形成“数据供给—价值释放”的良性循环。
随着人工智能发展,算力与电力之间的关系更加紧密。
在实际运行中,用户请求通过网络传输至数据中心,GPU集群开始工作,电力转化为算力完成推理计算,结果再返回用户。
在这一过程中,风电、光伏、水电等能源通过算力转化,以词元形式参与到AI服务之中。
“Token工厂”:数据中心的新角色
在英伟达GTC大会上,英伟达CEO黄仁勋提出,数据中心将不再是单纯的算力载体,而是一座“Token工厂”——输入数据和电力,输出词元。
围绕词元生产能力,相关企业持续推进技术布局,例如推出新一代AI平台、探索能源供给方案等。
在快速发展的同时,也存在一些现实挑战:
在芯片设计与制造环节,先进工具与高端工艺仍有不足;
在算力结构方面,部分数据中心配置仍以传统架构为主,难以完全适配大模型需求。
随着智能体时代开启,算力与电力协同发展仍需进一步推进。
文汇报(id:wenhuidaliy)综合自澎湃新闻、人民日报、长安街知事等
编辑|实习生林雅薇、王秋童