昨天,全新理想L9 Livis发布会开完之后,如果只盯着新车参数看,很容易把它理解成一场旗舰SUV的常规升级:更强的算力、更先进的底盘、更聪明的智驾、更豪华的家庭空间。
但这是理想要表达的核心吗?
过去几年,科技行业最热闹的地方在大模型。人们讨论Chatbot,讨论Agent,讨论AI会不会写代码、做PPT、生成视频,讨论机器人什么时候能进工厂、进家庭。可所有这些讨论最后都会落到一个问题上:AI如果只能停留在屏幕里,它再聪明,也只是一个答案机器。AI只有进入物理世界,能感知、决策、行动,才真正开始改变生活和生产。
这也是“具身智能”突然变成热门词的原因。问题是,具身智能的第一台大规模商业化设备会是什么?每个人有不同的想象和答案。
李想在与罗永浩的对谈中,给了一个很有判断力的定义:自动驾驶是具身智能的上半场,通用人形机器人是具身智能的下半场。此外,李想还系统化将上下半场分成共六个阶段,并分别对应具体落地时间节点,时间线从辅助驾驶初期的2018年,贯穿至2040年的通用人工智能(AGI)。
这句话的价值在于,它没有把自动驾驶继续放在汽车功能的小框里讨论,而把车放进了整个AI产业的下一阶段里。汽车除了是交通工具和移动终端,更是一个在真实世界中高速移动、持续感知、实时决策并承担安全责任的机器人。
昨天发布的全新理想L9 Livis,正是理想把这套判断落到现实产品里的第一步。
AI的下一站,不求更会聊天,要长出肉身
过去两年,AI产业的一个明显变化是:人们不再满足于它能回答什么,而开始追问它能替我做什么。
Chatbot时代,AI的核心能力是理解语言、生成内容。它可以帮人搜索信息、写文案、做分析、出主意。但从Chatbot到Agent,行业真正想完成的跃迁,是让AI具备任务能力:理解目标、调用工具、拆解步骤、执行动作、反馈结果。
再往前一步,Agent如果要离开屏幕,进入家庭、道路、工厂、商场这些真实空间,它就必须拥有身体。它要看见世界,理解空间,判断风险,控制动作,还要在不确定环境中持续学习。这就是具身智能的本质。
从这个角度看,汽车其实天然就是具身智能最早成熟的形态之一。
一辆智能汽车要面对的物理世界,远比手机或电脑复杂得多。它每天都要处理天气、光照、行人、车辆、施工、突发障碍物、道路博弈和用户情绪。它不能只给出建议,而必须在毫秒级时间里做出动作。它的每一次判断,都会直接影响人的安全和体验。
所以,自动驾驶几乎是具身智能最现实、最严苛、也最有商业规模的第一战场。
李想提出“具身智能上下半场”论的背后,某种意义上是在给行业重新划边界。过去,自动驾驶、机器人、大模型、智能硬件经常被分成不同赛道,各有各的估值逻辑和技术路线。但从具身智能的视角看,它们其实在共享同一组底层能力:感知、模型、芯片、操作系统、执行器,以及真实场景中的数据闭环。
这也是汽车企业切入具身智能的特殊优势。
汽车企业没有从0开始造一个“会动的AI”。它们原本就在制造一个复杂的移动机器,拥有大规模硬件交付能力、供应链能力、安全验证体系和真实用户场景。智能驾驶积累的感知、规划、仿真、模型训练能力,也可以迁移到更广义的机器人系统中。
更重要的是,汽车是一个足够大的商业场景。具身智能最难的地方是让它在真实世界里持续运行、迭代、创造价值,自动驾驶恰恰提供了这样一个入口。
这也解释了为什么理想此时要把自己从“新能源车企”重新定义为“具身智能企业”。
并非换一个更时髦的标签,产业逻辑推到了这里:当汽车的竞争从电动化进入智能化深水区,真正决定上限的,不光靠电池、电机、电控,也不靠座舱屏幕和语音助手,靠谁能把AI真正接入物理世界。
中高端汽车未来3到5年的竞争,本质上会越来越像具身智能系统的竞争。
谁能让车看得更远、理解得更深、反应得更快、动作更精确,谁就能在下一轮汽车产业格局里拿到主动权。
理想的“逆共识”,本质是提前把车看成机器人
理想这家公司有一个很鲜明的特征:它并不总是站在行业共识最热闹的地方,但经常站在用户需求最终会抵达的地方。
第一次是增程。
在新能源行业早期,纯电是更容易被资本、媒体和技术叙事认可的方向。增程一度被看作不够先进的过渡路线。但理想判断的是另一个更朴素的问题:对家庭用户来说,补能焦虑、长途出行、全家乘坐的确定性,是不是比路线纯粹性更重要?
后来市场证明,这个判断并不浪漫,却足够有效。理想并非用增程对抗纯电,而用增程解决当时纯电尚未完全解决的真实生活问题。
第二次是家庭SUV。
当很多车企仍在强调性能、操控、品牌个性时,理想把家庭放在产品定义的中心。外界曾经用“冰箱彩电大沙发”调侃它,但这套表达背后,其实是对汽车空间价值的一次重新理解。
车不只是驾驶机器,也不只是从A点到B点的交通工具。对很多中国家庭来说,它是周末出游的客厅,是孩子休息的第二空间,是一家人在路上的生活容器。理想把这个需求做得非常具体,也因此在中高端家庭SUV市场建立了清晰坐标。
第三次,就是具身智能。
这一次的“逆共识”更大。因为它没有选择某一种动力路线,也没有重新定义一个座舱场景,而是重新定义汽车本身。
在理想的说法里,全新理想L9 Livis被装上了具身智能的五个关键部件:芯片是心脏,模型是大脑,感知系统是眼睛,底盘是手脚,操作系统是神经系统。
这套比喻听起来很直观,理想确实开始按这个逻辑重构技术和组织。
从时间线上看,这不是昨天才有的概念。理想从2021年立项自研操作系统,2022年立项自研800V主动悬架和自研芯片,2023年立项自研大模型,随后MindGPT、星环OS、端到端+VLM、VLA司机大模型陆续交付。到全新理想L9 Livis,芯片、模型、感知、底盘、操作系统第一次在一辆旗舰SUV上形成相对完整的闭环。
这条线索说明,理想不是凑具身智能的热闹,才把自动驾驶包装成机器人概念。更准确地说,它过去几年做的很多“重投入”,现在开始被一个更大的战略框架解释清楚。
芯片和模型,是这套框架的核心。
李想把未来汽车竞争壁垒类比为手机行业:手机时代,苹果的壁垒来自芯片和操作系统,高通芯片和安卓系统则支撑了另一套产业生态。到了具身智能时代,技术制高点会落到芯片和模型的联合设计上。
这很关键。
过去行业喜欢谈算力,动辄几百上千TOPS。但进入大模型和具身智能时代,仅有算力并不够。芯片架构要适配模型,模型训练要理解芯片约束,感知、规划和控制要在端侧稳定运行。未来真正的差距,只来自芯片和模型能否co-design。
这也是理想从2022年开始自研芯片、从2023年开始做基座模型的原因。
做这件事很贵,也很慢。理想2025年研发投入达到113亿元,其中AI相关投入占比约50%。2026年研发投入计划仍保持在120亿元左右,AI相关投入继续占约一半。这样的投入是在为下一阶段竞争建立底层能力。
更有意思的是组织变化。
理想在2026年1月进行研发体系调整,从过去按软硬件功能划分部门,转向按照“数字人”和“硅基人”的方式组织研发。它把芯片、数据集、操作系统放入“脏器系统”,把感知、预训练、后训练、强化学习和基础设施放入“脑系统”,再把软件Agent和硬件执行体系分别作为“软件本体”和“硬件本体”。
这听起来有点像科幻,但背后是一个很现实的管理问题:当汽车变成具身智能体,传统车企按控制器、部门、零部件划分的研发方式,会越来越难支撑系统级智能。
如果团队们分别只负责眼睛、大脑、手脚,但彼此之间没有共同目标,那么最后很容易出现大脑很强、身体很迟钝,或者硬件很先进、软件调不动的情况。具身智能需要系统协同,而非功能堆叠。
所以,理想这次真正值得行业关注的除了一辆新L9,还有它把一家车企的研发组织,开始改造成一个面向具身智能的系统工程组织。
这件事的行业意义在于:汽车公司未来的核心能力,可能不再局限于“造车能力+软件能力”的简单相加,更在于像造一个智能生命体一样,同时具备心脏、大脑、眼睛、神经和手脚。
这也是为什么“理想做AI不是冒险,不做才是冒险”这句话成立。因为如果汽车未来会成为具身智能的上半场,那么车企继续只把自己理解为制造商,才是最大的战略风险。
L9 Livis是理想具身智能的第一具“肉身”
回到昨天发布的全新理想L9 Livis,它最值得讨论的,就是它第一次把理想对具身智能的理解,装进了一辆可交付的量产车。
所谓具身,不能只有大脑。它必须有感知、计算、动作、系统调度,也有真实环境中的反馈。L9 Livis的意义在于,把五个关键系统放到了一起。
先看“心脏”。
全新理想L9 Livis搭载两颗自研5纳米马赫M100芯片,有效算力达到2560 TOPS。这颗芯片是全球率先基于数据流架构研发的大算力端侧推理芯片,面向AI原生设计。它的重点不只是算力数字,而在于架构可以服务模型。
这对于具身智能很重要。因为车在路上行驶时,智能不能完全依赖云端。它必须在端侧完成大量实时推理,在极短时间内处理复杂传感器数据,并把判断转化为动作。芯片就是这个系统的能量与计算供给。没有足够强、足够匹配模型的端侧推理能力,再先进的模型也很难真正进入物理世界。
再看“眼睛”和“大脑”。
L9 Livis搭载3D ViT感知模型和马赫VLA模型。理想之所以说这代车“首次敢讲具身智能”,关键就在于感知方式发生了变化。
过去很多智能驾驶系统对世界的理解,仍然带有二维图像识别的影子。它可以识别车道线、行人、车辆、红绿灯,但对真实三维空间的理解还不够充分。人类司机开车时,不只是看到物体,而是天然理解距离、速度、遮挡、空间关系和潜在意图。
3D ViT的技术本身,就是让车辆更接近这种三维空间理解。这一技术的意义,不仅仅是将车辆的感知能力大幅提升,而是下一阶段,进入到L4无人驾驶以及通用人形机器人下半场,一个AI具身机器人必备的感知能力。
马赫VLA模型则对应“会思考的司机”。它要处理的不止“前方有车所以减速”这种单一规则,还有更复杂的道路语境:施工路段如何绕行,前车爆胎如何防御性减速,遇到倒车车辆如何礼让。具身智能的关键就在这里,它不能只识别物体,还要理解情境。不能只输出答案,还要形成动作。
然后是“手脚”。
一辆车再聪明,如果底盘仍然停留在传统机械逻辑里,智能就会被身体限制。L9 Livis搭载的“完全体”线控底盘和800V主动悬架,解决的是AI如何高效控制车辆身体的问题。
线控底盘包括线控转向、后轮转向和EMB线控机械制动。转向和制动由电信号取代传统机械或液压路径,意味着系统从发出指令到完成动作的链路更短、响应更快。据理想介绍,线控机械制动相比传统液压制动缩短约0.1秒响应时间,120公里/小时高速制动距离缩短3米以上。
800V主动悬架则让四个车轮真正实现独立解耦。它由4个800V液压泵、4支双阀CDC减振器与空气弹簧组成,单轮主动支撑力超过1万牛,并取消传统防倾杆。遇到坑洼可以主动伸长,遇到凸起可以主动收缩,转弯时主动抵消侧倾,急加速不抬头,急刹车不点头。
这些技术听起来像高端底盘配置,但放到具身智能语境里,它们的意义更深:汽车的“肉身”开始具备更高自由度、更快反应速度和更强可控性。自动驾驶越往高阶走,车辆越需要一个能被AI精确调用的身体。
最后是“神经系统”。
星环OS承担的角色,是把芯片、模型、传感器、底盘、座舱和整车控制串联起来。没有操作系统,硬件和软件容易变成一堆孤岛。有了自研操作系统,车才能成为一个统一调度的智能体。
据介绍,星环OS配合全线控底盘,可以把端到端延迟压缩到300毫秒左右,反应速度比人类更快。这个指标的重要性在于,具身智能不是静态推理,它要在现实世界里连续感知、连续判断、连续动作。延迟越低,系统越像一个协调的身体。
所以,全新理想L9 Livis的真正角色是它的第一个现实载体。
它先把“司机+生活助理”这件事放进车里。未来的自动驾驶不应该只是把人从A点送到B点。一个真正的智能司机,应该能接孩子父母、洗车、充电、保养,甚至在家庭生活中承担一部分时间管理和任务执行。车从交通工具变成家庭智能体,这是具身智能上半场最有可能率先落地的场景。
李想认为,具身智能的上下半场的边界衔接得非常紧密。未来买L4自动驾驶车的人和购买家政机器人的人,90%可能是同一拨人。这句话背后是一个很现实的判断:对家庭来说,司机、保姆、家政都是时间和精力的再分配。
过去,这些服务只属于极少数人,只有超级富豪可以同时拥有。科技进步真正有公共价值的地方,是把原来少数人才能享受的服务,通过规模化技术变成更多家庭负担得起的能力。
这也是具身智能不同于上一轮移动互联网的地方。
移动互联网改变的是信息分发、社交关系和消费方式。具身智能要改变的,是物理世界中的劳动、照护、出行和家庭服务。它影响的不只是屏幕上的内容,而是人每天如何移动、生活、照顾家庭、把时间从重复事务中释放出来。
理想的行动值得放在这个大背景下理解。
它不是唯一一家在做具身智能的公司,也不可能凭一辆车定义整个产业。但它的特殊性在于,它试图用汽车这个已经成熟的大规模商业载体,率先跑通具身智能的上半场:先让车拥有更完整的身体,再让车成为一个能够感知、理解、行动、服务的智能体。
这件事如果成立,汽车产业和机器人产业之间的边界会被重新划定。车企不再只是车企,机器人公司也不再只是机器人公司,未来真正的竞争者,可能都是那些能同时掌握芯片、模型、系统、硬件和场景的具身智能公司。
结语
很多时候,行业喜欢把未来想象成一个突然降临的东西:某一天,人形机器人走进千家万户,L4自动驾驶全面普及,AI从屏幕里走出来,开始替人干活。
但真正的产业变化,往往不这样发生。
它通常先伪装成一次产品升级、一次系统迭代、一次组织调整,甚至一场看起来还在讲车的发布会。直到几年后回头看,人们才发现,新的行业边界已经被悄悄推开。
昨天的全新理想L9 Livis发布会,表面上还是一场新车发布会,但它背后的问题已经超出了汽车行业:AI如何拥有身体?具身智能如何商业化?机器人产业的第一阶段会在哪里出现?一家车企怎样从制造交通工具,走向制造能够行动的智能体?
李想给出的“上下半场”答案已经非常清晰,它提供了一个足够清晰的跨行业观察坐标。这让自动驾驶不再只是智驾功能的迭代,让机器人不再只是遥远的科幻想象,也让汽车重新获得了一种更大的技术叙事。
过去十年,理想证明的是,一家车企可以通过理解家庭用户,把被低估的需求做成一个市场。接下来十年,它要面对的问题更难:一家汽车公司能否把车真正做成具身智能时代的第一类大众机器人。
这不是一个可以靠发布会完成的答案。但全新理想L9 Livis,至少让这个问题第一次有了一具清晰的肉身。
特别策划