在近期举办的GTC 2026大会上,黄仁勋的一段话引发了市场深思。他指出,AI产业的重心正在从“训练模型”向“推理应用”转移,未来每一秒钟、每一次交互,背后都是海量Token的生成与消耗。而近期中国发展高层论坛2026年年会上,国家数据局为Token正式定名——“词元”,并给出重磅定调:“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。中国日均词元调用量在2026年3月已突破140万亿,本年度三个月时间又猛增40%以上。
词元的“变现”路径,决定了近期半导体周期的真实走向。当市场的焦点还停留在英伟达新一代GPU能否继续称霸时,一个深刻的边际变化正在发生:推理侧的需求,正以远超训练侧的速度膨胀。这一变化,不仅重塑了AI算力的结构,也为中国半导体产业链,尤其是科创50,带来了一个蕴含预期差的投资窗口。
图:后续token需求更多在海量推理部分
数据来源:易方达基金词元变现的“拐点”:为何推理侧利好国产算力:
过去两年,AI算力的核心驱动力是“训练”——巨头们比拼的是谁能用最多的芯片、最快的速度,训练出参数更大的模型。这种模式对芯片的要求近乎苛刻:最先进的制程、最高的单卡算力、CUDA生态的绝对统治等,英伟达因此成为最大赢家。
但当AI进入应用爆发期,逻辑发生了根本转变。推理,这个将模型能力转化为实际服务的过程,开始占据算力消耗的主导地位。与训练不同,推理场景追求的是“综合成本最低”与“能效比最优”。在一个AI客服每天处理千万级对话、一个视频平台实时生成海量内容的时代,用昂贵的高端GPU去做所有推理,既不经济,也不现实。这就给了国产算力一个关键的突破口,推理侧的芯片需求是分层的:在金融高频交易、自动驾驶决策等高端场景,依然需要最先进的芯片;但在占据绝对多数份额的海量推理场景——比如互联网搜索、内容生成、企业级应用——核心诉求已转变为“够用、便宜、稳定”。而这恰恰是国产芯片通过架构创新(如ASIC、LPU)和成本优化能够发力的主战场。
更重要的是,国产芯片的“可用性”正在被快速验证。以华为昇腾、寒武纪、海光信息为代表的国产算力厂商,其产品在FP8算力等关键指标上已逼近国际主流产品,且正加速适配国产大模型。当推理需求开始放量,下游应用厂商为了控制成本和供应链安全,天然会倾向于采用性价比更高的国产方案。这种“需求侧分层+供给侧替代”的双重逻辑,构成了当前半导体投资中一个显著的预期差。
图:中端推理、海量推理需求为国产半导体提供机遇
数据来源:易方达基金科创50:捕捉“国产算力生态”的优质工具:
面对这样一个结构性的机会,投资者自然会问:应该如何布局?市场上与半导体相关的指数产品众多,但经过深入对比可以发现,科创50指数在暴露国产算力产业链的完整性、稀缺性以及成长迭代能力上,相比各类AI相关行业指数具备其独特优势。
首先,从权重结构来看,传统的半导体/芯片行业指数多侧重于芯片设计公司,而科创50虽同样以半导体为核心(占比约70%),但其成分股的分布更接近于“国产算力的完整硬件底座”。科创50中,中芯国际等晶圆代工龙头占据了显著权重,中微公司、拓荆科技等核心设备商也名列其中。这意味着,当推理需求爆发时,科创50不仅能捕捉芯片设计端的订单红利,更能直接受益于晶圆代工产能利用率的提升、以及先进封装等制造环节的价值重估。这种 设计+制造+设备”的全产业链暴露,使其在国产替代的复杂进程中,具备了更强的稳健性与受益广度。
其次,从调样机制来看,科创50的季度调样与“梯度培育”机制,使其对新兴硬科技龙头的捕捉能力超过普通行业指数。传统半导体指数调样频率较低,且主要依据市值排名,往往在公司进入成熟期后才纳入,容易错过高速成长阶段。而科创50依托科创板,每季度进行一次调样,并与科创100形成有效的梯度衔接。表现优异的成长股会从科创100调入科创50。例如在2026年3月的最新调样中,科创50新纳入了量子通信龙头国盾量子、检测设备龙头中科飞测等前沿方向标的。这种机制让科创50始终保持着对 “新质生产力”的高敏感度,能够及时纳入在AI推理、先进封装、新兴设备等领域脱颖而出的新龙头。
图:科创50在半导体细分领域内涵盖全面
数据来源:WIND当AI的叙事从“训练算力”转向“词元变现”,市场对国产算力的认知差正在成为新一轮投资的主线。除了单纯的半导体相关行业指数,科创50凭借其“全产业链覆盖+高成长迭代能力”的独特结构,同样能受益于这一轮以“效率优先、国产替代”为特征的AI推理浪潮。对于投资者而言,理解周期之变,选择适配之器,或许正是把握下一阶段科技行情的钥匙。科创50,为那些希望配置国产算力核心资产的投资者,提供了一个更纯粹、也更完整的答案,综合来看,科创50ETF易方达(588080)跟踪误差较小、流动性充裕,能够高效对接科创50的投资价值。