Dojo的死亡,特斯拉万亿AI帝国梦的破碎与重生
创始人
2025-08-17 20:02:42
0

2025年7月23日,特斯拉的Q2财报电话会议。埃隆·马斯克(Elon Musk)一如既往地向华尔街传递着乐观且极具感染力的情绪。当谈到公司倾注心血打造的AI超级计算机Dojo时,他充满了自信:“我们预计Dojo 2将在明年某个时候实现规模化运营,其规模大约相当于10万块H100芯片” 。


这番话无疑是一剂强心针。在投资者眼中,Dojo不仅是特斯拉实现完全自动驾驶(FSD)的技术基石,也是其从一家电动车公司蜕变为万亿市值AI巨头的核心引擎。摩根士丹利的分析师甚至曾为其描绘了高达5000亿美元的潜在价值 。


然而,没有人预料到,这场“壮观”的梦境会如此迅速地走向终结。仅仅三周后,风暴来临。2025年8月初,彭博社的一则爆料震惊了整个科技圈:Dojo项目团队已被解散,其负责人彼得·班农(Peter Bannon)即将离职 。紧接着,在8月9日至11日的那个周末,马斯克本人通过他的社交平台X,用一系列帖子亲手为这个曾经的明星项目画上了句号。他将这一戏剧性的转折,包装成了一次深思熟虑的战略升级,宣称Dojo 2已经走进了“一个进化上的死胡同”,而特斯拉的未来,将聚焦于另一款名为AI6的“融合架构”芯片。


从“相当于10万块H100”的豪言壮语,到“进化死胡同”的残酷论断,中间只隔了不到20天。这背后究竟发生了什么?这并非一次简单的项目调整,而是一场交织着技术豪赌、人才风暴、商业现实与巨头博弈的硅谷式戏剧。Dojo项目的终结,不仅是特斯拉AI战略的一次重大挫败,也为所有试图在人工智能时代挑战硬件王权的野心家们,上了一堂价值数十亿美元学费的警示课。


一、垂直整合的“第一性原理”与Dojo的诞生


要理解Dojo为何诞生,必须先理解马斯克和特斯拉对“垂直整合”近乎偏执的追求。从自建超级充电网络、开创直营销售模式,到自研电池和自动驾驶芯片,特斯拉的成功在很大程度上源于其对核心技术和供应链的绝对掌控。当AI成为公司未来的核心时,将算力这一“新石油”的命脉交到他人手中,是马斯克无法容忍的。


这个“他人”,主要就是英伟达(NVIDIA)。


Dojo项目的种子,早在2019年4月22日的特斯拉“自动驾驶投资者日”上就已埋下了。那时的特斯拉正面临一个前所未有的挑战:如何处理来自全球数百万辆汽车摄像头产生的、如洪水般涌入的视频数据。这些数据是训练FSD神经网络的燃料,而传统的计算架构,在处理这种规模的视觉数据时显得力不从心。


马斯克的解决方案,充满了“第一性原理”的味道:与其购买昂贵且并非为特斯拉量身定做的通用GPU,不如从零开始,打造一个完全为自家算法优化的专属计算系统。这一战略的背后,是三重野心:


1. 摆脱依赖,掌控成本:彻底告别英伟达,避免被其高昂的定价和紧张的供应链所掣肘。马斯克曾直言:“如果他们(指英伟达)能给我们提供足够的GPU,我们可能就不需要Dojo了。但他们不能,因为他们的客户太多了。”


2. 极致优化,追求性能:设计一种专门针对特斯拉计算机视觉工作负载的ASIC,通过架构上的创新,在性能和能效上实现对通用GPU的超越。


3. 构建护城河,定义未来:通过从芯片、软件到算法的全栈自研,构建一道任何竞争对手都难以逾越的、深不见底的技术护城河。


2021年8月19日,特斯拉首届AI日,Dojo项目正式向世界揭开神秘面纱。当特斯拉展示其自主设计的D1芯片和革命性的“训练模块”(Training Tile)时,整个行业为震惊了。这不仅仅是一块芯片,而是一个宏大的宣言:特斯拉不仅要造车,还要定义驱动未来AI的基础设施。


随后的几年里,Dojo项目似乎一路高歌猛进。2022年AI日,特斯拉公布了将Dojo扩展为完整“ExaPOD”超级计算机的宏伟蓝图。2023年7月,Dojo V1超级计算机正式投产,标志着项目从研发走向了实际应用。公司更是计划在2024年底前,为这个项目再投入10亿美元。2024年1月,一笔5亿美元的投资被宣布用于在纽约州布法罗市建立一个新的Dojo计算中心,这似乎预示着Dojo的光明未来。


然而,就在这片繁荣景象之下,未来的裂痕早已悄然出现。


二、Dojo的技术豪赌与致命缺陷


Dojo的核心,是一场前所未有的技术豪赌。它的设计理念极度激进,旨在通过硬件架构的根本性创新,来解决AI训练中的两大核心痛点:带宽和延迟


1. D1芯片与“训练模块”的革命


Dojo的基础单元是D1芯片。这块由台积电7纳米工艺打造的芯片,在645平方毫米的巨大裸片上,丧心病狂地集成了500亿个晶体管和354个处理核心。其设计功耗高达400瓦,本身就是一头性能猛兽。


但Dojo真正的革命性之处,在于它如何将这些D1芯片连接在一起。特斯拉的天才工程师们利用了台积电最先进的InFO_SoW(集成扇出型片上晶圆)封装技术,将25个D1芯片无缝地集成在了一块完整的晶圆上,创造出了所谓的“训练模块”。


这堪称工程学上的奇迹。传统的超级计算机,需要通过复杂的网络电缆和交换机将成千上万的GPU连接起来,芯片间的通信延迟和带宽瓶颈是永远的痛。而Dojo的训练模块,则像是在一块巨大的电路板上创造了一个无缝的计算平面。芯片之间的数据交换,不再需要绕道外部网络,而是可以直接在晶圆内部高速穿梭。其离模块带宽高达惊人的36 TB/s,比当时的竞争对手高出一个数量级。理论上,由10个机柜、3000个D1芯片组成的ExaPOD,可以提供高达1.1 ExaFLOPS的BF16性能。


2. 致命的阿喀琉斯之踵:被“渴死”的计算核心


然而,这场豪赌从一开始就埋下了一颗失败的种子。Dojo的设计团队为了追求极致的互连速度,犯下了一个致命的错误:忽视了内存的重要性。


在Dojo的架构中,354个计算核心,每个核心仅配备了1.25MB的SRAM(静态随机存取存储器),整个D1芯片上没有了其他大型高速缓存或内存池。这个计算与内存的比例,被行业分析师批评为“完全不足以”支撑特斯拉想要训练的那些日益庞大的AI模型 。


这就好比建造了一台拥有F1赛车引擎的汽车,却只给它配了一个摩托车油箱。引擎的性能再强,没有足够的燃料也无法持续飞驰。现代大型AI模型,尤其是像Transformer这样的架构,在训练过程中需要频繁地读写海量的参数和中间数据,对内存容量和带宽的要求极高。Dojo的这点片上内存,在巨大的数据洪流面前,无异于杯水车薪。


为了弥补这一先天缺陷,特斯拉的工程师们被迫采取了一些“曲线救国”的措施,比如创造一种自定义的、精度更低的数据格式:可配置8位浮点数(CFP8),试图用更少的数据位来表示信息,以塞进那小得可怜的内存里 。后续的报道甚至披露,特斯拉不得不额外设计一款独立的PCIe内存卡,专门用来为Dojo系统提供足够的内存连接。这无异于承认了最初设计的重大失误。


这种对内存的吝啬,让人想起了另一家曾经的明星AI芯片公司Graphcore。其设计的IPU也采用了类似的思路,试图用大量的片上SRAM来替代传统GPU依赖的HBM(高带宽内存),最终也在与英伟达更均衡、更通用的设计竞争中败下阵来。


2. 看不见的冰山:软件生态的鸿沟


如果说硬件上的内存缺陷是Dojo的“明伤”,那么软件生态的缺失则是其更致命的“内伤”。


一块定制的芯片,需要一个完全定制的软件栈来驱动,包括编译器、编程模型和各种底层库。特斯拉甚至为此开发了一套自定义的指令集架构(ISA),而不是采用RISC-V这样的开放标准 。这意味着,特斯拉需要从零开始,重建一个英伟达耗费了十几年、投入了数百亿美元才建立起来的CUDA帝国。


CUDA的强大之处,并不仅仅在于其性能。它是一个成熟、稳定、灵活且拥有庞大开发者社区的生态系统 。无数的AI框架、科学计算库和应用程序都建立在CUDA之上。对于开发者而言,这是一个熟悉且高效的平台。而要让他们放弃这一切,去学习和适应一个全新的、封闭的、未经检验的Dojo软件栈,其难度和阻力可想而知。


开发这个软件栈的复杂度和成本,很可能是压垮Dojo项目的、那座不为外人所见的巨大冰山。


3. “进化死胡同”的技术必然性


Dojo的架构,实际是“偏科”的,它为特定的短跑比赛(低延迟、高互连的视觉模型训练)而生,却牺牲了参加其他项目(内存密集型、架构多变的大模型)的能力。然而,AI模型的发展日新月异,从CNN到Transformer,再到混合专家模型(MoE),模型架构的迭代速度远超硬件的开发周期。


一个内存极度受限的硬件架构,在面对未来模型演进时显得异常脆弱。一旦FSD的下一代模型需要更大的状态空间、更复杂的注意力机制,Dojo的性能就可能遭遇“悬崖式”的崩溃。相比之下,英伟达的GPU凭借其巨大而灵活的HBM内存池,展现出了更强的通用性和适应性 。


所以,马斯克所说的“进化死胡同”,或许不仅仅是项目失败后的一个体面说辞,它在某种程度上也揭示了一个残酷的技术现实:AI模型演化的路径,已经悄然偏离了Dojo最初铺设的那条狭窄而陡峭的轨道。


三、帝国的裂痕:一场“灾难性”的人才雪崩


如果说技术上的缺陷是Dojo的慢性病,那么核心团队的集体出走,则是压垮这头巨兽的最后一根稻草,是导致其闪电崩盘的直接导火索。


故事的核心人物是两位芯片设计领域的传奇人物:加内什·文卡塔拉曼(Ganesh Venkataramanan)和彼得·班农(Peter Bannon)。


文卡塔拉曼,这位印度裔工程师,曾在AMD工作近15年,是芯片设计界的老将 。他于2016年加入特斯拉,从零开始组建了自动驾驶硬件团队,并领导开发了业界首款FSD芯片。他正是Dojo项目的最初负责人和灵魂人物。然而,在2023年底,文卡塔拉曼悄然离开了特斯拉 。


接替他领导Dojo项目的,是同样声名显赫的彼得·班农。班农的履历堪称辉煌,他曾在苹果公司担任首席架构师,主导了iPhone 5中首款32位ARM CPU的设计,是苹果自研芯片王朝的奠基人之一 。在加入特斯拉后,他一直是芯片工程的关键人物。


然而,就在马斯克于2025年7月财报会议上高谈阔论Dojo 2的宏伟蓝图时,一场“兵变”正在水面下酝酿。


2025年8月初,媒体爆出,包括班农在内的约20名Dojo核心工程师,已经集体离职。更具戏剧性的是,他们的去向都是一家名为DensityAI的神秘初创公司。而DensityAI的创始人,正是几个月前离开特斯拉的加内什·文卡塔拉曼。


这已经不是简单的离职,而是一场釜底抽薪式的“叛逃”。文卡塔拉曼、班农以及这20名工程师,几乎就是Dojo项目知识产权和工程能力的活载体。他们的集体出走,瞬间掏空了Dojo项目的大脑和心脏。设计和实现Dojo这样复杂且创新的系统,需要高度专业化的知识和长期的团队磨合。这种机构知识的流失,在短期内是毁灭性的,几乎不可能被替代。


DensityAI的目标,是打造一个为汽车行业量身定制的全栈AI平台,从芯片到软件,提供一站式解决方案。这听起来,像极了Dojo项目最初的愿景,只不过这一次,它将在特斯拉的围墙之外,由Dojo的原班人马去实现。


这场“灾难性”的人才雪崩,让马斯克和特斯拉陷入了极其尴尬的境地。一个仍在烧钱、尚未证明其决定性优势、且失去了核心大脑的项目,其存在的合理性瞬间崩塌。马斯克在财报会议上的乐观预测,与几周后项目的戛然而止形成了强烈的讽刺。这表明,取消Dojo并非一次从容的战略调整,而是一次对突发危机的被动反应。


马斯克事后“进化死胡同”的解释,更像是一种危机公关,一种在项目因人力资本崩溃而被迫终止后,为了挽回颜面而进行的叙事重构。正如一位网友在社交媒体上尖锐评论的那样:“他(马斯克)别无选择,只能取消Dojo,因为团队里太多人不想再为他工作了。”


四、英伟达,无法逾越的护城河


在Dojo的故事中,英伟达就像一个无处不在的幽灵。特斯拉启动Dojo,是为了摆脱它;而Dojo最终的失败,却又一次印证了它的强大。


1. 一场从一开始就不对等的战争


与英伟达竞争,尤其是在AI训练芯片领域,是一项近乎不可能完成的任务。这家由黄仁勋领导的公司,其可怕之处不仅在于硬件性能的持续迭代,更在于其软件生态构筑的、深不见底的护城河。


从硬件上看,英伟达的创新周期快得令人窒息。当特斯拉的D1芯片(基于7nm工艺)在2021年亮相时,英伟达的A100已经占据市场主导。而当Dojo在2023年艰难投产时,基于更先进的4nm定制工艺、性能更强的H100已经开始大规模出货 。而现在,更为强大的Blackwell架构GPU也已发布。这意味着,像Dojo这样的自研项目,往往陷入一个尴尬的循环:当你耗费数年、投入巨资研发的产品终于问世时,它对标的已经是英伟达上一代、甚至上上代的产品。


更重要的是,特斯拉自身的行为也暴露了Dojo的窘境。就在大力宣传Dojo的同时,特斯拉从未停止过对英伟达GPU的疯狂采购。从最初的数千块A100,到后来的数万块H100和H200,特斯拉一直是英伟达最大的客户之一。截至2024年4月,已经投入运行的Dojo集群,其算力总和也仅仅相当于7500块H100 GPU,只占到特斯拉当时H100集群总算力的四分之一左右 。


这组数据无情地揭示了一个事实:在长达数年的时间里,Dojo从未真正成为特斯拉FSD训练的主力,英伟达的GPU始终是那个不可或缺的“幕后英雄”。Dojo更像是一个昂贵的、充满不确定性的“B计划”。


2. CUDA:真正的壁垒


正如前文所述,英伟达真正的护城河是CUDA。这个并行计算平台和编程模型,经过近二十年的发展,已经成为AI开发的事实标准 。它拥有一个由无数库、工具和开发者组成的庞大生态系统,其成熟度和易用性是任何竞争对手都难以企及的 。


选择自研芯片,就意味着要重建这一切。这是一项比设计硬件本身更为艰巨的任务。Dojo的失败,再次证明了挑战CUDA生态系统的难度。对于绝大多数AI研究者和工程师来说,时间就是生命,他们宁愿选择一个性能或许不是100%最优、但稳定、可靠且拥有丰富工具链的平台,也不愿去冒险尝试一个全新的、充满未知数的专有系统。


3. 财务压力下的理性选择


Dojo项目的终止,也与特斯拉当时面临的宏观经济压力不无关系。2025年第二季度的财报并不乐观,电动车业务收入同比下降16%,总收入下降12%。与此同时,由AI研发驱动的运营支出和资本支出却在持续飙升。


在这样一个“节衣缩食”的时期,继续为一个成本高昂、风险巨大、回报周期漫长,且核心团队已经流失的项目输血,显然是不明智的。砍掉Dojo,将宝贵的资本和资源集中到自动驾驶出租车(Robotaxi)和擎天柱(Optimus)机器人这些更接近商业化的项目上,是一个痛苦但理性的财务决策。


Dojo的取消,对英伟达而言是一次巨大的战略胜利。老黄再次向世界宣告:在AI算力的牌桌上,所有玩家最终都必须回到我这里来。这不仅巩固了其市场垄断地位,也让所有心怀“造芯梦”的挑战者们,不得不重新掂量一下自己将要付出的代价。


五、AI6芯片的“融合”新战略,无可奈何的妥协


在Dojo的废墟之上,特斯拉迅速构建了一套新的AI硬件架构,其核心是所谓的AI6“融合架构”。


马斯克的官方解释是,同时维护Dojo(为训练优化)和AI系列芯片(为车载推理优化)两条截然不同的设计路线,是对资源的巨大浪费。因此,未来的战略是“融合”,即将所有努力都集中在即将推出的AI6芯片上。这款芯片,将“非常适合推理,并且至少在训练方面也相当不错”。


马斯克甚至试图为Dojo的遗产找到一个归宿,他声称:“Dojo 3可以说以在单块电路板上集成大量AI6 SoC的形式存在” 。


1. 用“步枪”打“大炮”:一场技术上的豪赌


然而,这套说辞在技术专家看来,充满了妥协和无奈。AI训练和AI推理,是两种在计算需求和架构设计上截然不同的工作负载。


• 训练(Training),好比是炼钢。它需要在一个巨大的熔炉(数据中心)里,用极高的温度(大规模并行计算)、消耗海量的原材料(数据和能源),经过长时间的锻造(迭代),才能炼出一块好钢(成熟的模型)。这个过程追求的是极致的吞吐量和强大的并行处理能力,需要高精度的运算、巨大的内存和超高带宽的互连,以便在数千个处理器之间高效同步。英伟达的H100和Dojo D1,都是为这种“重工业”场景而生的“大炮”。


• 推理(Inference),则好比是将炼好的钢材,打造成一把锋利的匕首,并在需要时能瞬间出鞘。它追求的是在终端设备(如汽车、手机)上,以极低的延迟和能耗,快速地执行已经固化好的模型,做出精准判断。这个过程对单次运算的性能要求不高,通常使用较低精度的计算,对内存和互连的要求也远低于训练。特斯拉的AI系列芯片,就是为这种“轻巧”场景设计的“步枪”。


现在,特斯拉的新战略,本质上就是想用成千上万把“步枪”捆绑在一起,去执行原本需要“大炮”才能完成的攻坚任务。尽管马斯克说它“相当不错”,但用一款为低延迟、低功耗优化的推理芯片来进行大规模训练,其效率和性能几乎不可能与专门为训练设计的芯片相提并论。这很可能会创造出一个“样样通,样样松”的系统,为了架构的简洁而牺牲了最关键的训练性能。


这更像是一个在失去了Dojo这个“大炮”研发团队后,不得不做出的无奈选择。设计和验证两种顶尖芯片(一种训练、一种推理)成本极高,且需要两个独立的精英团队。特斯拉刚刚失去了其中一个。剩下的团队,专注于对公司核心产品(汽车、机器人)至关重要的推理芯片。因此,用推理芯片来“兼职”训练,并非源于什么革命性的技术洞见,而更可能源于一个“他们只剩下足够的资源和人力,来推进这一条芯片设计路线了”的残酷现实。


2. 重回“怀抱”:对外部伙伴的新依赖


Dojo的终结,也标志着特斯拉在AI训练硬件上实现完全垂直整合梦想的破灭。公司现在比以往任何时候都更加依赖外部的合作伙伴。


• 英伟达:特斯拉仍将是英伟达最重要的客户之一。数以万计的H100/H200 GPU将继续构成其高性能训练集群的基石。


• 三星:一纸价值165亿美元的巨额协议,让三星成为AI6芯片的关键代工伙伴,这意味着特斯拉将核心的推理硬件命脉,也部分交到了外部手中。


• AMD:AMD也被提及为潜在的合作伙伴,表明特斯拉正在采取更加多元化的供应商策略,以分散风险。


从试图颠覆规则的革命者,到重新拥抱行业分工的参与者,特斯拉在AI硬件上的战略,完成了一次痛苦但务实的回归。


六、最后


Dojo的故事,为这个高歌猛进的AI时代,提供了一个深刻而及时的警示。


它揭示了在AI硬件领域进行垂直整合的巨大难度。即便是像特斯拉这样资金雄厚、拥有顶尖人才和明确应用场景的公司,想要从零开始挑战一个由巨头和成熟生态系统所统治的领域,也同样困难重重。


也再次证明了英伟达护城河的深度。这条护城河不仅由一代代领先的芯片构成,更由一个名为CUDA的、几乎无法被复制的软件生态系统浇筑而成。任何试图绕过它的挑战者,都必须做好付出惨痛代价的准备。


同时,它也引发了关于专业化与通用化路线的重新思考。Dojo代表了专业化路线的极致,为一个特定任务打造的终极武器。它的失败似乎表明,至少在当前AI模型快速演进的阶段,通用GPU所提供的灵活性和适应性,仍然是更稳妥的制胜策略。


对于特斯拉而言,放弃Dojo虽然是一次挫败,但未必是世界末日。短期内,其FSD训练本就严重依赖英伟达,因此影响有限。长期来看,转向一个更务实、更开放的混合硬件策略,集中资源攻克自动驾驶和机器人这两个核心目标,或许是更明智的选择。


Dojo已死,但它所代表的那种挑战极限、试图用“第一性原理”重构世界的硅谷精神,并不会消失。只是这一次,现实给所有怀揣梦想的工程师和企业家们提了一个醒:在通往星辰大海的征途上,有时,选择站在巨人的肩膀上,比试图推倒巨人,是更快的捷径。


本文来自微信公众号:蒸汽猫TechMore,作者:沸腾的豌豆

相关内容

热门资讯

长征五号B遥一运载火箭顺利通过... 2020年1月19日,长征五号B遥一运载火箭顺利通过了航天科技集团有限公司在北京组织的出厂评审。目前...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
9所本科高校获教育部批准 6所... 1月19日,教育部官方网站发布了关于批准设置本科高等学校的函件,9所由省级人民政府申报设置的本科高等...
湖北省黄冈市人大常委会原党组成... 据湖北省纪委监委消息:经湖北省纪委监委审查调查,黄冈市人大常委会原党组成员、副主任吴美景丧失理想信念...
《大江大河2》剧组暂停拍摄工作... 搜狐娱乐讯 今天下午,《大江大河2》剧组发布公告,称当前防控疫情是重中之重的任务,为了避免剧组工作人...