来源:美股研究社
2026 年 3 月,硅谷传来一则并未登上头条却足以震碎行业信仰的消息:OpenAI 宣布无限期暂停 Sora 的免费公开测试服务,官方理由轻描淡写地提及“基础设施优化”,但内部流出的备忘录却直指核心——电网容量告急与算力成本失控。
这记闷棍敲醒了所有人:当每一次用户点击都在燃烧电力,互联网的底层逻辑已经悄然改写。过去我们迷信“连接”的价值,认为只要把人聚在一起,财富就会自动涌现;如今我们被迫直视“计算”的物理代价,意识到智能的每一次闪烁,都是对地球能量的一次提取。
从“规模即护城河”,走向“能源即护城河”,这不仅是商业模式的迭代,更是文明演进中资源约束的再次收紧。在这个新纪元里,代码不再是轻盈的比特,而是沉重的瓦特。
从“规模效应”到“成本诅咒”:古典互联网范式的崩塌
过去二十年,古典互联网的商业叙事充满了某种迷人的欺骗性。它告诉投资者,只要用户规模足够大,边际成本就会无限趋近于零。
无论是社交网络、搜索引擎还是电商平台,本质都是“固定成本 + 极低边际成本”的模型。这也是为什么资本市场长期愿意为互联网公司提供极高估值——因为一旦胜出,赢家通吃,且利润率可以无限扩张。那时的增长是性感的,亏损是暂时的,规模是唯一的真理。
但以 Sora 为代表的生成式 AI 产品,在 2025 年至 2026 年的市场验证中,正在无情地打破这一根基。Sora 的问题,从来不是“烧不起钱”,而是烧钱的方向发生了本质变化。
在传统互联网中,新增一个用户,服务器成本几乎可以忽略不计,带宽的复用率极高;而在 AI 时代,每一个用户请求,都对应真实的算力消耗,背后是 GPU 运转、电力消耗以及推理成本。2025 年下半年,多家尝试将 AI 视频生成功能免费开放的平台,在短短三个月内被迫转为付费或限制次数,原因正是“用的人越多,亏得越惨”。
这意味着一个根本性转变:用户规模不再是利润杠杆,而是成本放大器。
当用户增长不再带来边际成本下降,反而持续推高成本曲线时,古典互联网的估值模型开始失效。
我们看到了一个奇怪的现象:2026 年的财报季,一些拥有庞大用户基数的 AI 应用公司,其营收增长反而伴随着更剧烈的亏损扩大。这是因为他们的每一次“病毒式传播”,都在瞬间引爆了推理成本的指数级上升。
Sora 的“死亡”,或者说其商业化路径的艰难,本质是这一模型失效的第一个标志性事件。它宣告了“免费换规模”时代的终结,迫使所有创业者重新计算每一个 Token 的真实成本。
在这个新世界里,盲目追求日活(DAU)不再是一种荣耀,而可能是一种财务自杀。那些曾经引以为傲的“网络效应”,在高昂的电力账单面前,显得如此脆弱不堪。
算力=Token=电力:AI互联网的成本结构重构
如果说过去互联网的核心资源是“流量”,那么 AI 时代的核心资源已经变成了一条更底层的等式:算力 = Token = 电力。
这一等式的含义极其残酷——用户看到的每一段视频、每一张图片、每一次生成,本质上都是电力被实时转化为内容。在 2026 年的技术语境下,我们不再单纯讨论模型的参数量,而是讨论“每千瓦时能生成多少高质量内容”。这带来了三个深层变化,正在重塑整个行业的成本结构。
首先,成本结构从一次性投入变为持续消耗。传统互联网的资本开支(CapEx)主要集中在前期建设,服务器买回来可以用好几年,折旧是线性的。而 AI 公司的成本则更像能源企业——每一次调用都是“即时计费”。这使得毛利率天然承压。
微软和谷歌在 2025 年的财报电话会中,不约而同地提到了“推理成本优化”的重要性,这并非技术炫技,而是生存必需。他们发现,即便模型效率提升了 30%,如果用户调用量增长了 300%,总成本依然会失控。
其次,规模效应被“反规模效应”替代。用户越多,调用越频繁,算力消耗越高。除非模型效率出现数量级突破,否则收入增长必须持续对冲成本增长,企业很难进入“利润释放期”。这解释了为什么 2026 年市场上出现了大量“小而美”的垂直模型,它们不追求通用智能,只追求在特定任务上的能效比。那些试图打造“全能助手”的巨头,反而陷入了越做越亏的泥潭。
再者,竞争壁垒从算法转向能源与基础设施。模型能力的差距在缩小,开源模型与闭源模型的效果差距在 2025 年后迅速收窄,但算力成本的差距却在拉大。
拥有更低电力成本、更高效数据中心布局的公司,将逐渐形成新的护城河。这也是为什么越来越多的 AI 公司开始强调“推理成本下降曲线”,以及“每 Token 成本”。
因为在 AI 时代,决定胜负的,不再只是模型能力,而是生成一单位内容的真实成本。创造力,第一次被物理定律明码标价。当你按下生成键时,你不仅是在消费内容,更是在消费远方发电厂燃烧的煤炭或流转的水能。
Sora“死亡”背后:互联网从规模战争走向电力战争
如果沿着这个逻辑继续推演,一个极具冲突性的结论浮现出来:未来互联网的终局,不是流量垄断,而是能源垄断。
当 Token 成本成为核心变量,谁能接近“零成本电力”,谁就拥有定义商业模式的权力。这意味着,下一代互联网巨头,很可能不再是单纯的软件公司,而是具备以下特征的“复合型玩家”:一端掌握算力(GPU/ASIC),一端掌握能源(电力/数据中心),中间用模型进行价值转化。
从投资视角来看,这将带来一轮结构性迁移。资本不再只追逐模型公司,而是开始重新定价电力资产、数据中心、算力基础设施。那些拥有廉价能源(例如核电、水电、可再生能源布局)的地区和公司,正在成为 AI 时代的隐形赢家。
2026 年,我们观察到亚马逊和谷歌纷纷与核电运营商签订长期购电协议,甚至直接投资小型模块化反应堆(SMR)项目。这不再是企业社会责任(CSR)的作秀,而是对核心生产资料的抢占。在得克萨斯州和北欧,大片的数据中心集群正围绕着新建的风电场和核电站拔地而起,形成了新的“能源 - 算力”共生体。
更重要的是,这一趋势可能彻底改变互联网竞争的地理格局。过去互联网巨头诞生于用户密集地区,如硅谷、北京、深圳,因为那里有人才和资本。而未来,算力中心可能诞生于电力最便宜的地方。冰岛、挪威、加拿大魁北克,甚至中国西部的水电富集区,正在成为新的“数字硅谷”。
这种“算力迁徙”将导致互联网物理架构的分散化。为了降低延迟,边缘计算节点会靠近用户;但为了降低能耗,核心训练和重推理任务会向能源洼地转移。这种地理上的撕裂,将带来新的网络架构挑战,也会重塑全球数字经济的版图。
国家之间的竞争,将不仅仅是芯片制程的竞争,更是电网承载能力和能源绿色化程度的竞争。在 2026 年的地缘政治中,“算力主权”已经等同于“能源主权”。
那些无法解决能源瓶颈的国家,即便拥有最顶尖的算法人才,也可能因缺乏廉价电力而在 AI 竞赛中掉队。互联网的中心,正在从人流密集的城市,漂移到能源富集的荒原。
结语:我们在为谁的梦想买单?
Sora 并不是一个失败的产品,而是一面镜子。它让市场第一次清晰看到:当互联网进入 AI 时代,决定生死的变量,已经从“用户增长曲线”,变成了“电力成本曲线”。
但这背后隐藏着一个更深层的哲学命题。人类历史上,每一次生产力的飞跃,本质上都是对能量利用效率的提升。蒸汽机解放了肌肉,电力解放了黑夜,而人工智能试图解放大脑。
然而,解放大脑的代价,是巨大的能量消耗。
未来的商业竞争,将是一场关于“能效比”的极限运动。谁能用更少的电,生成更聪明的智能,谁就能活下来。这或许意味着,我们将进入一个“智能节制”的时代。
无限生成的乌托邦可能只是幻觉,真实的未来是精打细算的。每一段生成的视频,每一行代码,都需要我们支付昂贵的“硅基税”。
这并非悲观的预言,而是理性的回归。它提醒我们,技术从来不是脱离物理世界存在的魔法。在追逐算法的星辰大海时,不要忘记了脚下的电网。毕竟,没有电力支撑的智能,不过是黑暗中的一串乱码。
真正的护城河,不在代码里,而在发电厂里。我们终将明白,在这个被算法包裹的世界里,最珍贵的资源不再是注意力,而是那驱动一切运转的、沉默而磅礴的能量。