黄仁勋坚定地表示:“不进入中国就等于错过了 90%的市场机会。”他深知中国市场的巨大潜力和活力。中国拥有庞大的消费群体、快速发展的科技产业以及不断提升的消费能力。在全球科技竞争日益激烈的当下,忽视中国市场无异于自断前路。中国的科技创新氛围浓厚,消费者对先进科技产品的需求旺盛。只有积极布局中国,才能紧跟市场趋势,抓住发展机遇,在这片广阔的市场中大展拳脚,实现企业的持续增长和壮大。
Ben:大家好,本周的Stratechery访谈提前发布,因为我有机会在Jensen Huang结束他今早在中国台湾举办的Computex 2025主题演讲后与他当面交流。我计划本周稍后继续探讨这次访谈中的一些话题,因此本着与各位分享对话的初衷——这也是本访谈系列的核心——我希望尽快将其发布。
我此前曾在2022年3月、2022年9月和2023年3月三次与Huang进行访谈。那些访谈的显著之处在于Huang极力让世界理解GPU computing的潜力;而如今这一潜力正在实现的过程中,Huang和Nvidia正面临一整套全新的问题,尽管他们仍在不断推进computing的发展。
本次访谈一开始便聚焦于这些与政治密切相关的新挑战:我们讨论了上周与Saudi Arabia和United Arab Emirates的合作协议、美国在芯片管控上的策略为何会危及美国和Nvidia的长期主导地位。Huang还论证了AI为何将在不久的将来推动GDP增长,甚至有可能减少贸易逆差。接着我们聊到今天的keynote以及上个月在GTC上的keynote。
正如我在访谈中提到的,这两场keynote的内容差异之大让我感到惊讶,或许是因为面向的受众不同:今天的对象是OEMs(ZP注:中国台湾原始设备制造商)、组件制造商及其企业客户,而上个月则是美国超大规模云服务商;理解Nvidia的关键是他们想同时向这两类客户销售。为此,我们讨论了为何全栈Nvidia解决方案能最大化效用,包括Dynamo如何提升推理性能,同时Nvidia在软件与系统构建上的策略又如何让他们可以只向客户销售其所需的组件。
中东AI战略与全球扩散规则的博弈
Ben:Jensen Huang,欢迎再次做客Stratechery。
Jensen Huang:很高兴见到你,Ben。
Ben:这次能与你线下面谈真的太好了,我们之前的对话都是通过Zoom进行的,而你现在人在台湾。你刚刚宣布了一栋新大楼的建设,离我家很近,这太令人兴奋了。我们之前交谈时,我感觉你特别希望让世界了解GPU的潜力。当我们最初交谈时还在pre-ChatGPT时代,而现在全球市场在你每次发布财报时都如履薄冰。我知道我们正处于静默期,我不会问财报,但处于这样的地位——几乎成为全球焦点——你是什么感受?
Jensen Huang:你这个问题我现在真回答不出什么有趣的内容。我的回答是:我对这件事没有什么特别的感觉,但我确实意识到,我们正在重新定义Nvidia,而这也始终是我们在公司核心关注的事,我们在重新定义Nvidia,是为了始终领先趋势,走在行业的前沿,同时解决那些难题,为行业做出贡献。
但更重要的是,如今我们不仅创建了一个计算平台,也重新定义了我们的公司,我们更像是一家数据中心规模化公司,并首次提供能够完全协同工作的技术,但同时这种集成是可拆分的,以便整个生态系统都能与之协同。
但我在keynote上提到的一件非常重要的事是,我们现在首次造的计算机,不仅是为科技行业服务的,我们是在为一个名为AI的新产业造计算机。AI部分属于科技范畴,同时也具有人力属性,它增强了我们熟知的劳动能力。随着我们进入机器人领域,这一点将愈发明显。这种被称为AI的新技术,本质上构成了一个全新的产业,而这个产业将由工厂驱动,这些工厂将需要大量计算机。人们才刚刚开始意识到,我们正迈向一个新未来:所谓的数据中心,其实是AI工厂,而且规模可能非常庞大。
Ben:我注意到你提到了Satya Nadella在Microsoft财报电话会上报告他们处理的Tokens数量,我记得那是上个季度。这是你本季度财报中最喜欢的一项吗?我也立刻注意到了,这是个很棒的指标。
Jensen Huang:实际上,当前真正被生成的Tokens数量比那要高得多得多。那只是Microsoft为第三方生成的部分,他们自身的Token消耗要大得多,而且还不包括OpenAI,所以你可以想象实际的规模有多大。
Ben:据我了解,实际的数量相较于报告中的数字是非常非常庞大的。你最近一直在进行世界巡回访问——你我都知道台湾很美,我也提到你们的新办公园区——我想问问中东这个季节是什么样的?
Jensen Huang:很热,但不潮湿。
Ben:是干热吧?
Jensen Huang:对,是干热。我其实还挺喜欢的,因为室内空调很冷,我一走出去晒晒太阳,感觉特别好。但那边的夜晚简直太棒了,真的非常棒。在户外吃饭、喝茶,感觉真的很不可思议。
Ben:我当然也是想问你们与Saudi Arabia和UAE宣布的这些AI交易。从你的角度看,这些为何重要?又为何你一定要亲自到场?
Jensen Huang:因为他们邀请我去,而且我们此行的任务是宣布两个非常有雄心的AI基础设施建设项目,一个在Saudi Arabia,一个在Abu Dhabi,这两个国家的领导人都非常前瞻,认识到本国参与AI革命的重要性,他们认识到这是一个非凡的机会,他们拥有丰富的能源,却缺乏劳动力,他们国家的发展潜力受到劳动数量、人口数量的限制。所以他们首次拥有机会将经济模式从能源驱动转向数字劳动力和机器人劳动力的驱动,例如Agents和机器人。他们对此高度关注,表达得也非常清晰明确。
Saudi Arabia的王储对这件事表达得非常清晰,也非常有热情,甚至对技术本身都有深入理解。而Abu Dhabi的Sheikh Tahnoun同样对此充满热情,非常具有前瞻性,对该技术的影响和他们国家的机会理解得非常透彻。所以我很高兴能在那里,我们正与这两个国家合作。
我们在Saudi Arabia协助创建了一家新公司,名为HUMAIN,他们的目标是在全球舞台上建设这些AI工厂,承载来自世界各地的公司,例如OpenAI也在那里,这是一个非常宏大的计划。
Ben:这是一项重大转变。而这其中也涉及对《AI扩散规则》(AI Diffusion Rule)的部分回撤,我认为这些规则对这些国家特别严苛,设置了限制数量的规定,并且必须由US公司控制,在某种程度上被US构建的体系所限制。Nvidia,我想与你们以往的立场不同,这一次强烈反对了这些政策,从你的角度来看——这让我感觉你必须“迅速成长”。
Tae Kim在他的书中写道,Nvidia就像是一辆围绕你打造的F1赛车,而你是那位驾驶员,你是否曾一度不愿思考这些政府事务,以至于Nvidia在很长一段时间内都没认真思考这类问题,但突然之间你们成了全球最重要的公司,你被迫必须非常迅速地了解这些事?
Jensen Huang:其实不是我不想去想,而是以前我根本没有必要去想。在Nvidia大部分的发展历程中,我们都在专注于打造技术、建设公司、发展行业,以及竞争。
Ben:是的,在一个完全由竞争驱动的行业中。
Jensen Huang:每天、每一刻都在努力。我们在构建供应链,也在打造完整的系统。你可以看到,我刚才提到的每一项都具有巨大的规模与广度,本身就极具挑战性,但突然之间《AI扩散规则》(AI Diffusion Rule)出台了,我们当时就指出这一点,现在大家也都能看出来,这个政策完全是错误的,对美国来说尤其如此。如果扩散规则的目标是确保美国保持领先,那它现在的写法恰恰会导致我们失去领先地位。
AI不仅仅是名为模型的软件层,AI是一个全栈体系,这也是为什么大家总在谈论Nvidia的系统、基础设施、工厂等等。AI是全栈的。如果美国想在AI上保持领先,就必须从全栈的各个层面引领——包括芯片层面、工厂层面、基础设施层面、模型层面以及应用层面——AI包含所有这些。
你不能简单地说,“我们来写一条《AI扩散规则》(AI Diffusion Rule),只保护某一层,牺牲其他所有层”,这毫无意义。在国际竞争者已经赶上的这个时刻,我们却限制美国的AI技术,这种做法完全违背常识,而且我们早就预见到这一点。
Ben:您所说的国际竞争者,是指其他的模型吗?
Jensen Huang:中国做得非常出色,全球有50%的AI研究者是中国人,你是无法阻止他们的,也不可能阻止他们推进AI的发展。
Ben:我们是否因为对他们施加了限制(特别是在内存管理和带宽方面),反而刺激他们做出了更好的成果?
Jensen Huang:每个人都需要竞争。公司需要竞争来激励自己,国家也一样,这一点毫无疑问。不过,我完全预料到中国会一路紧跟。华为是一家极具实力的公司,是世界级的科技企业。中国的研究人员和AI科学家同样是世界一流的。这些人不是所谓的“华人AI研究者”,而是真正意义上的世界级AI研究者。你去Anthropic、OpenAI或DeepMind的办公室走一圈,会发现那里有一大批AI研究者,他们来自中国。这当然是合理的,他们非常杰出,所以他们做出杰出成果对我来说并不惊讶。
用AI Diffusion的方式限制其他国家获取美国技术,这个使命本身就表达得完全错误,它应该是在为美国技术的全球扩散争分夺秒,而不是阻碍。如果目标是让美国保持领先,那么AI Diffusion的效果恰好相反。
AI Diffusion还忽视了一个大问题,那就是AI技术栈的工作原理。AI技术栈就像一个计算平台,它是一个平台。你的平台越大、越强,其安装基础也越大,吸引的开发者也越多,他们会在上面运行与开发。当有更多开发者在上面开发时,会让运行在你计算平台上的成果和应用变得更好。结果是你能卖出更多,更多人采用你的计算平台,从而进一步扩大你的安装基础,这又吸引了更多开发者来开发AI模型,这种正向反馈机制对任何计算平台来说都是至关重要的,这正是Nvidia今天成功的原因。
以为美国可以不参与中国市场竞争——一个聚集了全球50%开发者的市场——从计算基础设施和计算架构的角度来看,完全说不通。我们应当为美国企业创造机会参与中国市场竞争,以抵消贸易逆差,为美国民众创造税收、建设项目、提供就业机会。
中国市场的重要性与错失代价
Ben:我们是否可以说目前已经完成了一半?因为我们一开始谈的是海湾国家的合作协议和《AI扩散规则》(AI Diffusion Rule),从国家间竞争的角度来看,你肯定能看出,这些国家的参与意味着什么?
Jensen Huang:这两个问题是密切相关的。我想表达的是:如果我们不在中国竞争,而是允许中国生态系统在没有我们参与的情况下构建一个丰富的体系,那么一旦他们构建出新的平台,而且这些平台不是美国的,而这又恰逢全球AI技术正处于扩散时期,那么他们的技术和领导力将扩散到全世界。
Ben:这正是我的观点,从你的视角来看,我们也许算完成了一半。至少我们没有在其他国家主动退出。
Jensen Huang:没错。
Ben:但我们应该彻底放开限制,让Nvidia重新进入中国市场。
Jensen Huang:是的,但我认为实际上,不进入中国就等于错过了90%的市场机会,这不是一半一半,而是90%的问题。
Ben:所以我们现在只做了10%的事情。
Jensen Huang:没错,完全正确。
Ben:说实话,我完全同意你的观点。在我看来,现在的政策试图限制芯片的销售,却又允许他们获得所有芯片制造设备,这完全是本末倒置——而且说实话,追踪芯片比追踪制造设备要困难得多。华盛顿有种说法是:“芯片制造商或者半导体设备制造公司这些年一直活跃在华府游说圈,他们很擅长游说,而Nvidia不在这里,因此吃了亏。”你觉得这个说法成立吗?是不是说你们在让华府理解你们的观点方面确实非常困难?
Jensen Huang:这几年我们真的非常努力地在华府建立自己的存在感。我们在那儿只有寥寥几人,而与我们规模相当的公司往往都有几百人。但我们的这几位同事非常了不起,他们正在讲述我们的故事。他们不仅帮助人们理解芯片是如何工作的,还帮助大家理解生态系统如何运行,AI生态系统又是如何协同的,以及一些政策所带来的意料之外的后果。
我们希望美国赢。每一家公司都应该希望自己的国家赢,每个国家也都应该希望本国企业能够取胜,这种愿望不是坏事,而是非常值得鼓励的情感。人们渴望成功,本身就是一件积极的事。竞争是好事,追求卓越是好事。当一个国家想要变得卓越,我们不该对他们心生怨恨;当一个企业努力追求卓越,我也不会嫉妒他们。这种竞争促使我们超越自己,做得比过去更好。所以我很喜欢看到那些渴望卓越的人。
毫无疑问,中国正在追求卓越,为他们点赞!他们就该有这样的追求。所有我认识的全球AI研究者和科学家,之所以能走到今天这一步,都是因为他们渴望卓越,而他们也确实做到了卓越。我认为,这种想法……
Ben:要赢就必须打压对手?
Jensen Huang:对,这种说法在我看来毫无道理。我们应该做的是加快脚步。Nvidia今天之所以能站在现在这个位置,我们从未依赖任何人的支持,我们是靠自己跑出来的。只要让我们继续全力奔跑就行了。如你所说,如果我们去阻碍别人,只会让他们变得更强大,因为他们本身就很出色。
Ben:我同意。作为一个美国人,这让我感到非常沮丧。我认为我们应该通过超越创新、加快速度来赢得竞争,而不是通过“收梯子”、切断他人的发展路径、设置官僚主义的重重障碍、试图追踪一切来取胜。这种做法让我觉得极其令人沮丧,甚至背离了美国精神。
Jensen Huang:是的。无论如何,我认为总统是看得明白的,他希望美国赢。
Ben:那我再问一个相关的问题,因为正是这个政府切断了H20的出口,而这款芯片其实是你们根据上一届政府的要求专门设计的,结果现在却突然说“这不行”,而与此同时他们又在推进新一轮合作。外界的批评声音也出现了:“这可能会重新为中国打开通道,带来某些潜在的风险”等等。这感觉像是政府态度的转变,虽然他们可能会说还是同一个逻辑。但我觉得过去六周里,美国与中国之间确实发生了很多变化,可以说是风向转了。
你是否感觉到,现在人们终于意识到这个世界已经高度互联相依,一边发生的事总会波及到另一边,这不是那么容易就能拆开的系统?是否会回归到更务实的路径?在这方面你是持乐观态度,还是已经为最坏情况做准备?
Jensen Huang:总统有他想要达成的目标,我支持总统,也相信他会为美国带来一个很好的结果。他会以一种尊重的姿态去努力,同时保持竞争的意愿,也会寻找合作的机会。我感受到了这一切,也确实看到了这些趋势。当然,我不在白宫,我无法确切知道他们的真实想法,但这是我目前的感知。
首先,关于H20的禁令,这是我们在Hopper上所能做到的极限了,我们已经砍掉了太多,几乎所剩无几。我们已经报废了——我记得是55亿美元——历史上还没有哪家公司报废过这么多库存。所以这项新增的对Nvidia H20的禁令是极为痛苦的。它的代价巨大,不只是我们损失了55亿美元的库存,更是放弃了150亿美元的潜在销售额,以及大约30亿美元的税收。中国市场的年规模大约是500亿美元,不是五千万,是500亿。500亿美元相当于一整个Boeing公司的价值,不是指一架飞机,是整家公司。如果我们放弃这个市场,也就放弃了与之相应的利润、规模效应,以及整个生态系统的建设……
Ben:从长远来看,这才是对CUDA的真正威胁。
Jensen Huang:没错。
Ben:中国会构建出替代方案。
Jensen Huang:完全正确。任何认为仅仅通过一招封杀H20就能切断中国发展AI能力的人,都是对现实一无所知。
AI推动经济扩张与GPU生态战略
Ben:接下来我还想谈谈关于“电力”的角度,不过我们可以先换个轻松的话题。先把那些关于政府的内容放一边,稍后再回来。关于金融市场与政府的关系,这是我想从第三个角度切入的问题。今天的keynote你一开场就说:“我们是一家基础设施公司,我们需要五年的路线图。”你顺带提到,当年你创立Nvidia时的TAM(ZP注:总可服务市场)预估是3亿美元。那你究竟是在什么时候真正意识到,“我们将成为一家基础设施公司”?我回顾我们之前的对话,我一直觉得你是想让人们看到这种可能性。你看到了GPU计算的可能性,但如今这一规模,是否也让你多少感到震撼?
Jensen Huang:如果你一如既往地看我的keynote,你会发现如今正在发生的很多事,其实我在五年前就讲过了。当时我的措辞可能不够清晰,语言也没有现在这么精准,但我们所描绘的发展方向是高度一致的。
Ben:所以说,现在你每次keynote结尾都在频繁提到机器人技术,这就是你向我们展示的五年后预览,我们确实应该认真对待。
Jensen Huang:没错。事实上,我已经连续讲了三年了。
Ben:对,所以还要过几年就会实现了。
Jensen Huang:是的,我认为两三年后就会实现。对这个行业而言,有一个非常深远的转变是,过去60年我们属于IT行业,也就是提供技术和工具的行业,为人类所用——而现在,我们第一次即将“跳出”IT预算领域——过去我们的产品被算入IT预算,而现在将进入制造预算或运营预算的范畴。
制造预算是因为我们正在打造机器人,或者说机器人系统正在参与实际产品的生产;而运营预算则是因为我们创造了数字劳动力。全球的运营预算和制造预算总量是多少?大概50万亿美元?这是一个惊人的数字。而IT行业的规模大约为1万亿美元。由于AI的推动,我们即将进入一个高达50万亿美元的产业领域。
当然,我最希望看到的,也是我认为极有可能发生的是:尽管某些工作岗位会发生转变,甚至消失,但更多新的工作岗位会被创造出来。由物理机器人担任Agent的机器人系统,很有可能推动全球GDP的扩张。这是因为目前全球普遍存在劳动力短缺,这也是为什么大家几乎都在就业。你看看美国,失业率处于历史最低点,这就是因为我们根本没有足够的劳动力。
餐厅招不到人,很多工厂同样在招聘方面非常吃力。我认为,雇佣一个年薪10万美元的机器人,将成为企业的自然选择,因为它们能立刻提升生产效率、创造更高收入,所以在接下来的五到十年内,我们很可能会经历GDP的快速增长,以及一个全新产业的崛起——围绕Token制造系统所构成的新生态,而人们将逐渐理解这一点。
Ben:我觉得今天的keynote还有一点非常有意思。我在来之前为了这次访谈做了准备,我还以为它会是GTC的复述或重复,结果发现它其实完全不同。这是我的理解,你得告诉我对不对:GTC的内容是面向超大规模计算企业的,而今天的演讲则是面向企业级IT客户的,仿佛是两个截然不同的市场。
Jensen Huang: 是的。
Ben:我的理解对吗?受众确实是不同的吧?
Jensen Huang:是的,企业级IT或Agent与机器人——Agent面向企业IT,机器人面向制造业。这背后的原因非常明确,这是生态系统发展的起点。
Ben:我们聊聊GTC的那场keynote,那是我最喜欢的一次。我一直在看你所有的演讲,很多年了。那次你有种“Jensen教授”般的气场,详细解释了数据中心的局限性、为什么Nvidia才是答案。我把它理解为一种“反ASIC”的表态。你既展示了Nvidia的产品路线图,像是在说“你们尽管来追”,又引入了延迟与带宽之间的帕累托曲线,而因为GPU具备可编程性,所以可以覆盖整条曲线;而大规模计算企业自然是那些会去造ASIC的玩家。我的理解正确吗?
Jensen Huang:你对内容的理解是对的,但我这么做的原因并不是为了“反ASIC”,我只是想帮助大家理解如何打造一个新的数据中心。我们已经思考这个问题很久了。挑战在于,数据中心的总能耗是固定的——100兆瓦就是100兆瓦,250兆瓦就是250兆瓦。所以,如果你把它当作一个工厂来建,那你首要的目标就是让每瓦功耗所产生的吞吐量最大化。因为你的总吞吐量——以Token计——会因用途而异。有的是便宜、免费的Token,有的则是高价值的Token,用户可能为它们支付每月1000美元,甚至1万美元。
Ben:你刚才还提到一个年薪10万美元的AI助手。
Jensen Huang:没错。雇一个年薪10万美元的AI Agent?我毫不犹豫。原因很简单,我们现在每天都在雇用年薪远超这个数字的人。如果我能用10万美元就让一个年薪50万美元的员工效率翻倍,那简直太划算了,当然会用。
在一个“AI工厂”里,你生成的Token质量差异很大。有的Token是免费使用的,有的是高价值Token,所以你要在这条帕累托曲线上全面覆盖。你不能只设计一个擅长某一端(比如高延迟或高带宽)的芯片或系统,否则它将被严重浪费,所以问题变成:如何构建一个系统,它能同时支持免费Token的生成,也能支持高质量Token的生成?
如果你的架构过于碎片化,那么你在不同任务之间灵活调度的能力就会受限。当大家认真思考这个问题时,会发现一个非常适合生成高频Token的系统,其整体吞吐量往往会非常低。如果你设计的是一个极高吞吐量的系统,它的交互性通常会很差,换句话说,每个用户每秒获取的Token数会很低。
你可以轻松贴近X轴(高交互),也可以靠近Y轴(高吞吐),但要把整个区域填满是很难的,这就是我们整个技术创新的核心所在——结合Blackwell架构、FP4、NVLink 72、HBM内存与容量之间的比例平衡、浮点计算量与内存容量和带宽的关系,最终实现了Dynamo这个关键的“解耦流式推理服务”系统,它既是软件生态,也是硬件系统。
Ben:我想问你关于Dynamo的事,今天你并没有提到它,但我觉得它非常有意思。
Jensen Huang:非常关键。
Ben:介绍一下它的核心理念吧。我记得你说过,Dynamo就是数据中心的“操作系统”。
Jensen Huang:核心理念是这样的:Transformer类型的推理任务被分为多个阶段,而每个阶段的资源使用情况,会根据用户、模型、上下文的不同而变化。因此我们将大型语言模型的处理过程拆分成多个子任务,其中第一步是pre-fill阶段,也就是上下文处理——就像它正在思考你即将要问什么。它会调用我关于你Ben的记忆,了解你喜欢深度对话类播客,如果我开始深入谈行业与技术,我会感到很自然。
Ben:对,现在不是在做晚间新闻式的“片段回应”。
Jensen Huang:没错。我感觉我可以深入讲这些东西,因为你能听懂,我不会觉得自己是在对着空气说话,所以我很自在地讨论这些技术。当AI驱动一个chatbot时,它也需要上下文。这意味着chatbot必须拥有记忆、处理上下文,甚至可能需要读取一两个PDF文件。这部分就是pre-fill阶段,这个阶段对浮点运算要求非常高。
然后是解码阶段,它负责生成具体的内容,进行推理,预测接下来的Token。一个完整的思维链会不断生成更多的Token,这些Token会重新进入上下文,引发更多Token的生成。因此它的整个推理过程是一步步进行的,有时还需要查阅外部资料。现代版本的AI,特别是Agent型AI、推理型AI,它们对浮点计算和带宽的需求都非常高,尤其是解码阶段对带宽要求极高,并且未来可能会更高。
Ben:但这也因任务而异。
Jensen Huang:对,具体会因内容和上下文不同而变化。
Ben:在解码阶段其实不需要很高的浮点精度。
Jensen Huang:没错。比如说,如果是one-shot任务,而且KV缓存已经很强,那就不需要太多浮点计算。但一旦你加入大量上下文,它所需的浮点计算就会迅速增加。Dynamo将整个推理过程拆解成多个部分,并将这些任务在整个数据中心中智能分发,合理调度每个处理器的负载——这是个非常复杂的系统。
Ben:它也与一个概念相关:如果整个数据中心被视为一个“大型GPU”,那你就需要有一个软件层来协调它,就像操作系统一样。
Jensen Huang:没错,Dynamo本质上就是AI工厂的操作系统。
Ben:当你展望这些“思维模型”“推理模型”的未来应用时——你是那种预测很准的人——你是否认为这些模型主要会被用在Agentic的工作流程中?它的缺点是需要等待模型思考完毕,或者,你可能会设定多个Agent并行工作,那样效率就会很好;又或者它们未来更重要的用途在于生成训练数据,优化one-shot模型表现,让人与AI的互动更高效?
Jensen Huang:我认为这取决于成本。但依我看,推理模型将成为未来的标准配置,因为我们处理这些模型的速度将会快得惊人。以Grace Blackwell为例,它的速度是原来的40倍。假设下一个节点又是40倍的提升,而且模型也在不断变强,所以在我看来,从现在到未来五年,我们对Agentic模型的处理速度提升10万倍,这是完全合理的预测。
Ben:这就是计算机的发展史。
Jensen Huang:没错。它其实在瞬间想了无数个问题,只是你看不到。现在的AI就算是“慢思考”,它也已经是快的了。
Ben:那本书叫什么来着?《Thinking Fast and Slow》。如果你把它应用到AI上,AI可能一秒钟就能把整本书读完,反而违背了书名的初衷。
Jensen Huang:说得对。
务实的企业战略与GeForce的持续价值
Ben:回到一个和政治相关的问题。你在谈论性能功耗比时,是否其实更多是在针对美国?毕竟在这个世界上,美国目前在新建电力设施方面存在巨大困难,而“电力”恰恰是AI发展的首要瓶颈。比如海湾国家,出于各种原因,它们获取电力更容易,基础设施更易建设。再看中国,如果“电力”不是最核心的限制因素,那么很多Nvidia原本要替你解决的问题,也许他们自己就能解决了。这是否也是你将GTC设在美国的原因之一?因为这段话其实是对美国市场在传递某种信息?
Jensen Huang:哦,我倒没从这个角度想过。但我认为无论如何,每座工厂的规模总是有限的。即使你的国家电力资源非常丰富,但你建的数据中心未必就有很多电力可用。所以我认为性能功耗比始终都很重要。
Ben:它总是重要的,只不过重要性因场景而异。
Jensen Huang:对,就是这样。但如果你一开始就规划好了,比如你说:“我这个架构每瓦性能只有一半,那我就多买一倍土地,多申请一倍电力,然后从头开始建设。”这也不是不行。可一旦你把所有这些因素综合起来,问题就来了。
别忘了,就算是基础设施本身,比如你要建一个1吉瓦的数据中心。我们做个简单的估算——其中光是建筑壳体、电力接入、土地成本、运营成本等,可能就得花掉300亿美元。再加上计算、网络、存储等所有其他硬件,再算个500亿美元,可以吧?那如果你因为性能差而不得不建两倍的数据中心,那你的300亿就变成了600亿。所以你必须找到极其便宜的计算资源来填补这部分支出差距。这就是为什么我一直觉得,在AI工厂的世界里,经济模型会告诉你:如果你的架构不够好,有时候差到一定程度,就算是“免费”,也不够便宜。
Ben:当然,如果你只有这一个选择,你还是会想办法用它。
Jensen Huang:没错。
Ben:那我们来对比一下今天的演讲吧。你今天反复提到一句话:“你全买我的,我很高兴;你只买一点,我也很开心。”在我完全反应过来之前,我已经隐隐感觉今天这就是一场面向企业客户的keynote(当然这是我自己的判断)。你表现出一种“企业CEO式的务实”,让我觉得:“他现在听起来真的像是做企业销售的领导了,真的很务实。”
当然,如果你买的是整套全栈方案,效果当然最好。尤其是你用“AI工厂”来形容整个架构时,用全套Nvidia产品自然能实现最大化回报。但现实中仍有很多客户只买部分产品。你当然希望他们买全套,但即使他们只买一个模块,只要他们开始用Nvidia,那他们很可能就会持续不断地买下去。所以从战略上看,这种做法也是非常合理的客户基础积累。
Jensen Huang:服务客户,本身就是一件聪明的事。你看看Nvidia的市场策略,我们一直都是做完整系统出身的,因为软件最终必须与硬件整合才能跑起来。但我们做得很有节制,足以让你在需要的时候把软件和硬件拆分。你可以选择不使用我们的软件,完全由你决定。你再看看我们设计系统的方式,我们已经把系统组件解耦到足够灵活的程度,如果你想换掉其中某一部分,是完全可以做到的。现在Grace Blackwell正在全球各地、各种云平台上进行集成部署,大家都采用我们的标准,虽然每家的环境略有不同,但我们都能适配进去。
我认为这就是Nvidia商业模式真正的挑战所在,也和我们想成为计算平台公司的目标高度一致。对我们而言,最重要的是我们拥有多个技术栈——如果你采用我们的计算栈,那太好了;如果你选择我们的网络栈(我对它的重视程度与计算栈相同),也非常好;如果你同时采用这两个栈,那就再理想不过了。
Ben:比如NVLink Fusion,客户也可以只用NVLink,和自己的ASIC集成——这其实跟我对GTC演讲所理解的“统一化”信息形成了强烈对比,但我也理解今天这个立场。问题就是,你的客户是谁?
Jensen Huang:我依然坚定地认为,Nvidia正在构建的是一个整体更优秀的系统,我始终相信这一点。如果我自己都不相信这一点,那就说明我们肯定哪里做错了,那我们必须自我修正。所以我可以完全肯定地说,Nvidia是世界上规模最大的加速计算公司,也是AI计算领域最大的公司。我们公司现在有3.6万至3.8万名员工,所有人都为这一件事而努力。说真的,如果哪天一个14人的小团队做得比我们好,那对我们来说会非常痛苦。因此我们会不断精进、持续超越。
Ben:但与此同时你也信奉“规模”,而实现销售规模的最佳方式就是:按客户想要的方式卖给他们。
Jensen Huang:对,完全正确。我有自己的偏好,但更重要的是确保我们能按照每一位客户想要的方式去为他们服务。
Ben:顺着这个话题,或许也是相关的:我跟一个朋友提起这次访谈,他说他儿子坚决要求我问你这个问题。一些游戏圈的人觉得——你今天确实提到了——整场keynote只有10%的内容和GeForce有关,但对他们来说那仍然非常重要。你是想说“这部分仍然重要,因为它与我们GPU的规模有关”?还是说,我该怎么跟朋友的儿子解释Nvidia与gaming之间的关系?
Jensen Huang:你看,我其实真希望能讲得更清楚:没有GeForce就不会有RTX PRO,也不会有Omniverse,今天我们视频里看到的每一个像素都不可能存在,更不用说机器人或Newton,所有这些都离不开GeForce。所以GeForce虽然没有被深入地展示在GTC上,但那是因为GTC主要面向的是高性能计算、企业客户和AI领域等。我们有专门为游戏开发者举办的发布会。因此,每当我做GTC时,我心里其实都有点过意不去,因为那一群人的产品没有成为主角。不过那只是因为GTC的受众不一样。但他们也知道,GeForce是我们所做一切的核心组成部分。
Ben:我的意思是,是不是很多玩家还没意识到,他们手中的GeForce早已不仅仅是图形渲染引擎了?
Jensen Huang:是的,完全正确。我今天也说了,我们现在只真正渲染10个像素中的1个,这个数字非常震撼。假设我给你一幅拼图,但只给了你10块中的1块,其余9块根本不给你,你得自己“凭空补全”。
Ben:我再给你提供一个“营销点子”,来把gaming和你做的其他事连在一起。你刚刚讲到你们在系统设计上非常有纪律性,可以将模块拆分,并通过软件管理各部分。老实说,这听起来就像是Windows的驱动问题,而这正是你们的核心能力之一。
Jensen Huang:是的,但驱动程序这个层面太底层了,里面包含太多内容、寄存器太多。其实“驱动抽象”这个理念本身就是一次革命,而Microsoft在其中发挥了巨大作用。如果没有驱动层的设计,Windows根本不可能发展到今天的高度。它通过API创建了一个抽象层,使得底层硬件即使变化也不影响系统运行。
我们现在的驱动程序是开源的,说实话,我并没有看到太多人来贡献代码,原因在于,我每发布一个新GPU,之前他们在旧驱动上做的所有工作就几乎都作废了,所以如果你不像Nvidia那样拥有大量工程师,就很难真正维持这个体系。但如果我们为每一代GPU都配套优化驱动程序,那么就能构建出一个良好的隔离层和抽象层,不管是CUDA还是DirectX,大家都可以在这之上开发。
Ben:你看,这是我给我朋友儿子的回答。我虽然必须向你提问关于政府政策的事,你也做出了精彩而热情的回应,但当我问到gaming驱动时,你的眼睛真的亮了起来,整个人明显兴奋了。
Jensen Huang:哦,是吗?
Ben:所以我觉得,一切都还在正轨上。
Jensen Huang:太好了。是的,我其实真的很爱GeForce。
Ben:你看,这就是面对面交流的好处。Jensen Huang,非常感谢你的分享。
原文章:https://stratechery.com/2025/an-interview-with-nvidia-ceo-jensen-huang-about-chip-controls-ai-factories-and-enterprise-pragmatism/
本文来自微信公众号:Z Potentials,编译:Li Jiahui