如果让你用三个词形容理想汽车,估计很多人脑子里会蹦出同一个答案:冰箱、彩电、大沙发。
在大多数人的刻板印象里,理想是一家“产品经理驱动”的公司,懂用户、很会做家庭向产品。
6月15日,Livis Day理想汽车软件与具身智能发布会,给大家带来硬核科技的另一面,从芯片、操作系统、感知系统到大模型等,理想拿出了一套全栈自研的完整技术方案。
更关键的是,这不是跟风,早在5年前它就已经开始布局。

五年磨一剑,技术都始于厚积薄发
2021年,当行业还在疯狂堆屏幕、比音响、卷座舱豪华感的时候,理想就已经把星环OS整车操作系统立项。
当时没人能理解,不就是个车机系统,基于安卓改改就行,为什么非要从零开始自研。
2022年,理想又正式立项自研AI芯片马赫M100。自研芯片投入大、周期长、失败率高,一家车企贸然闯入,大家都觉得会吃力不讨好。
但理想没有被外界的质疑声打倒。
2023年,大模型风口兴起,理想也组建基座模型团队,从底层开始自研具身智能大模型。
现在,这些自研技术都已经交出了一份不错的成绩单:
星环OS早已上车并宣布开源,打破了国际AUTOSAR架构的长期垄断;马赫M100芯片量产落地全新L9 Livis,是全球首款量产的动态数据流AI芯片;马赫VLA智驾模型、3D ViT感知、全线控底盘全部就位,形成了完整的技术闭环。
5年时间,理想把芯片、大模型、操作系统这些最核心的自研技术,几乎全部走通。
一家靠“产品定义”起家的车企,为什么要扎进最苦最难的底层技术里?
因为“冰箱彩电大沙发”能赢下第一个十年,但赢不了第二个十年。当所有车企都学会了做家庭向产品、开始堆配置的时候,产品定义能力就不再是护城河。

“现在的智能汽车并不是真的智能”,理想重新定义智能
发布会上,李想一上台就摆出了一个很多人质疑的问题:具身智能和造车有什么关系?
在他看来,现在的智能手机和智能汽车,都不是真正的智能,本质上还是功能驱动。
什么是智能手机、智能汽车?行业公认有三条标准:软件定义硬件、必须能够联网、系统持续升级。
但李想从三个维度提出了不太一样的判断:
安全上,传统智能汽车只能保证功能安全,遇到搞不定的复杂场景,就会交给人类接管。恰恰是这接管的一瞬间,反而成了事故的高发期;
能力上,现在的智驾只会前进和转向,倒车、碰到危险时靠边停车,它都还掌握不了;
效率上,反应速度远不如人类,大多数赶时间的情况下,很多人都会选择关掉智驾,自己开。

那真正的智能汽车是怎样的?理想给出的方案是:具身智能汽车。
用具身智能来打造一辆保护人类安全、独立完成任务、比人类更高效的具身智能汽车。
在他的构想下,具身智能汽车是4种角色的合体:一辆电动车+一位职业司机+一台AI计算机+一个生活助手。
具身智能汽车在遇到复杂问题时,不会丢给人类,而是自己想办法解决,你只需要对它下一句指令,之后等着它搞定。
现场演示了一个很有意思的案例,车内放着嘈杂的音乐,用户在音乐声中下指令让理想同学哄第二排的小朋友睡觉,理想车身立马开始摇晃起来,秒变婴儿车,同时,理想同学声音音调自动调低,空调变轻柔、灯光变暗。

拆解具身智能汽车,大脑、心脏、神经系统全自研
具身智能汽车不是一个抽象概念,理想已经把它形成了一套可落地的方案。
模拟人体,具身智能汽车的眼睛、大脑、心脏、神经系统、手脚等全部自研。

眼睛:3D ViT感知模型,“看懂”物理世界
传统激光雷达只能识别障碍物的距离和形状,但认不出红绿灯颜色、读不懂路牌文字、看不懂交警手势。
理想3D ViT,真正开始让系统从看见世界到读懂世界。
它是行业首次上车的三维视觉感知技术,能实时构建出场景里每个物体在三维空间的精确位置、姿态和动作。
发布会现场,通过理想L9 Livis车辆,3D ViT展示了它的全域三维感知能力。它重建了整个场馆的三维空间,台下观众的一举一动都被记录下来。

大脑:语言智能、机器智能模型双管齐下
理想汽车基座模型负责人詹锟认为,完整的具身智能和人脑一样,也分为两个部分:语言智能和机器智能。
语言智能上,理想发布两款自研模型:马赫Mind-Pro、马赫Mind-Edge。
马赫Mind-Pro在通用基准能力、指令跟随、超长文本理解、高阶数学推理、工具调用这些行业公认的容错程度最低的项目里,都稳居行业第一梯队。
除了纸面上的跑分外,它已经进入智慧出行、办公、问答、娱乐等全部车载场景。
另一款模型马赫Mind-Edge,则是行业真正落地的端侧原生具身智能体。
在演示短片中,用户在户外通过理想Livis眼镜,语音调控车内理想同学,让AI帮忙找到遗落在车上的耳机。
而在机器智能上,5月发布的马赫VLA大模型,则是从整车架构上完成了彻底重构,主打更安全、更高效、更强大。
综合响应速度仅0.28秒,比普通人类驾驶员0.45秒的反应速度,快了近一半,接近F1车手0.25秒的人类极限。
这0.17秒的差距,相当于在120km/h的速度下,多出了一台劳斯莱斯幻影的距离。
詹锟承诺,三季度将为Orin和Thor平台的老车主推送全新⻢赫VLA模型,四季度模型能力将对齐特斯拉FSD V14。
心脏:马赫M100,最强车规级芯片算力
理想自研的马赫M100,堪称本次发布会最硬核的技术突破之一。
它是全球首款动态数据流AI芯片,采用5nm工艺,单颗芯片算力达到1280TOPS,双芯算力2560TOPS,是目前全世界量产的、最强大的车规级推理芯片。
传统架构下,CPU就像个总管,所有任务都要它来调度分配,导致大量资源被浪费;数据流架构下,取消了总管一职,改成流水线作业,数据流到哪个计算单元,哪个单元就立刻开工,算完就传给下一个。
因此,马赫M100的算力利用率可以达到惊人的82%。
用它跑大模型,性能甚至能吊打桌面专业AI超算。

神经系统:星环OS,为AI原生设计的操作系统
星环OS很容易被误认为是车机系统,但它实际是理想为具身智能专门设计的操作系统。
“感知-决策-执行”全链路深度融合。结合全线控底盘的极速响应,理想把端到端时延压缩到了0.28秒,反应速度,比人类快40%。这就是系统协同的力量。
手和脚:全线控底盘,跟上大脑的决策速度
智能再强,执行跟不上也只是纸上谈兵。
理想L9 Livis配置“完全体”线控底盘,线控转向、后轮转向、EMB线控制动全套拉满,配合800V主动悬架。
它的存在,不只是为了提升驾驶体验,更在于让车辆的物理响应速度跟上了AI的决策速度。
比如马赫VLA的反应速度是0.28秒,如果底盘执行没跟上,那这些优化都得大打折扣。

自动驾驶是具身智能的上半场,人形机器人是下半场
看完大会,如果你觉得只讲了汽车,那可能有个很关键的点被忽略了。
自动驾驶和人形机器人,本质上都是同一套东西,都是有感知、有大脑、能行动的具身智能体,它们的底层技术,感知算法、大模型、芯片、操作系统、运动控制逻辑,高度同源。
据晚点统计,过去两年里,车企和智驾公司的核心成员,至少有20位流向了具身智能行业。其中,光理想汽车一家,就有10人。
因为理想的技术栈,从底层就是按照具身智能的逻辑来搭建,不是为了汽车单独设计。
现在车上打磨的所有技术,未来都能平移到人形机器人上。
李想判断,自动驾驶和人形机器人两条赛道,都是5万亿美金规模的市场,而且买智能汽车的家庭,大概率也会第一批买家用机器人。
理想借汽车这个成熟的载体,打磨出一套通用的具身智能技术体系,等到下半场人形机器人进场,就是降维打击。
按照理想的规划,上半场分三个阶段:2018-2023年是L2辅助驾驶,2023-2028年是L3自动驾驶,2028-2033年是L4无人驾驶。
下半场从2030年左右启动,人形机器人从6岁儿童的泛化能力,逐步进化到12岁、18岁水平,最终走向AGI。

从产品驱动到技术驱动,理想走向第二个十年
发布会上,李想说了一句话:“过去十年,我们创造了一个移动的家。下一个十年,我们会给车和家赋予生命。”
第一个十年,理想靠对家庭用户的精准洞察和超强的产品定义能力,从红海中突围,成为首个千亿营收的新势力车企。
产品定义能力可以帮你从0到1,却撑不起长期壁垒。产品、配置有可能被模仿,只有底层技术别人拿不走。
所以第二个十年,理想决心要从产品定义能力转向技术创新能力。
一些人喜欢拿“冰箱彩电大沙发”调侃理想,觉得它没技术含量。
但回过头发现,同行们也都开始学着理想做家庭场景、做空间体验,而这个时候,理想纵身一跃,进入了下一个阶段。
它不再是一家车企,而是向着具身智能科技公司转型。下一个时代的入场券,理想已经拿在手里。