李想造芯，一场不跟风的赌局,李想为什么决定去制造汽车

本文字数：3958｜预计6分钟读完

自有主张，另寻解法。

记者丨易思琳吴晓宇

编辑丨吴晓宇

2026年北京车展期间，理想汽车CEO李想组织了一场老友饭局。

当天，他与几位出走的高管们重聚餐桌，在场的有前总裁沈亚楠、前智驾预研负责人贾鹏、前智驾量产研发负责人王佳佳、前第二产品线负责人张骁，还有前智驾产品总监赵哲伦。

这些人，分别创立赫宇机器人、至简动力、斜跃智能、维他动力，有的专注于机器人，也有主攻机器狗。彼此调侃，这是一场“车人狗聚会”。

“车人狗聚会”，来源：贾鹏朋友圈

寒暄之外，几位离职高管向李想提了一个共性诉求：马赫M100能不能也向他们供应？

马赫M100，单颗芯片算力为1280 TOPS，领跑业内，也是全球唯一采用动态数据流架构的智驾芯片，其能减少缓存中的反复存取，提高AI运行效率。

“外采其他家的芯片，从工具链、稳定性，再到效率、成本，都不如马赫M100芯片。”李想在播客里说，那些老友清楚其自研芯片的水平。

自2022年开始，理想四年攻坚芯片，四年重构操作系统，三年打磨大模型，搭起一套具身智能体系，其在慢慢兑现李想的野心——成为一家人工智能的生态公司。

下注“数据流”

李想自研芯片的想法，萌生于2021年全球芯片荒。

彼时，芯片交货周期由30天拉长到6个月，单颗芯片价格暴涨5-10倍，头部车企拿走大半的芯片产能，留给新势力的就非常有限，供应链被卡了脖子。

2022年7月，李想从华为引入谢炎，将芯片、操作系统等统归到谢主管的系统与计算群组之下，正式组建芯片团队。

谢炎刚加入时，理想芯片团队只有两人，不到一个月又走一人。

“资源有限，是不是要先做小芯片试水？”剩下的那名员工问他。小芯片是指低成本、低算力的AI芯片，用于试错、验证基础能力。

一开始，谢炎明确反对做小芯片。

“我和李想有一个非常一致的意见：自研不是为证明自己有能力做，得真正解决问题。”

谢炎在采访现场告诉《21汽车·一见Auto》，团队很明确，车内AI算力的要求将越来越高，外购高端芯片的成本也越来越高，必须要着眼未来，如果自研做不到比外购更好，那做的意义不大。

理想汽车CTO谢炎

2022年11月，自研芯片在理想内部立项，团队规模10人左右。

当时，量产车上普遍搭载英伟达的Orin芯片，算力更大的Thor芯片还在研发中。经过半年分析，团队给自研设定了目标：一半成本、两倍性能，合计四倍效能。

谢炎清楚，这样的设定，延续英伟达的技术路线行不通。

“英伟达比你早启动几十年，积累比你深，资源比你多几个数量级。”他打比方，就像跟博尔特在100米赛道上，他又早跑2秒，不可能超过。

最终，理想选择动态数据流架构。

传统CPU/GPU芯片采用的是指令驱动，按照“先取指令，再取数据，再执行”的逻辑；而数据流架构，则是数据到齐之后立刻执行，执行完直接传给下一个单元，数据自己决定什么时候计算，不用 CPU/GPU 指挥。

这样一来，相比传统GPU架构，数据流架构能减少缓存中的反复存取，释放更多有效算力。

直到2026年，选择此架构设计智驾芯片的车企，只有理想，大家回避，核心顾虑有三：

其一，生态要从零搭建，自研编译器、调度器、模型映射工具链都要重做；其二，通用适配能力薄弱，此架构仅擅长规则化、标准化的AI运算，应对实时路况容错性不足；其三，芯片研发周期长，一旦新方向不对，近10亿元将成泡沫。

为什么理想敢押注小众架构？

“过去，数据流架构没发展起来，在于计算规模、数据规模不够大。”

谢炎解释称，当计算、数据规模大到一定程度，传统冯·诺依曼架构要扩展，额外代价会更高、效率更低，单一形态的、全新的计算架构完全有机会。

“采用动态数据流架构，没有赌的成分。”李想后来公开解释，团队手敲140万字的资料，来验证可行性。

死磕编译器

首款芯片于2024年流片，起初名字叫“舒马赫”，2025年改名为“马赫”。

“马赫是速度计量单位，代表速度快。我们做的是芯片，希望AI计算速度更快。”一位理想芯片团队人士向21记者解释称。

2025年，马赫芯片回片验证。

那一年，芯片团队的工作重心，从硬件调试转向为新的芯片开发编译器，同时做好芯片的改版和迭代，为量产上车做足准备。

《21汽车·一见Auto》独家获悉，当年3月，理想汽车召集算力单元部门进行封闭开发，为期3个月，核心就为了马赫芯片做编译器开发。

它是衔接硬件与算法的核心桥梁，能将程序员常用的编程语言，转换成芯片可识别、可执行的机器语言去执行。

“编译器要做的事，是给芯片做一套快速的适配接口，以快速地新算法部署在芯片上。”

一位行业人士向记者解释，芯片开发周期是3-5年，其更新节奏滞后于算法。芯片流片成功之后，得让它不停适应新算法，引入编译器，就能缩短开发周期、提高开发效率。

编译器研发的高门槛，源于硬件适配的复杂性。

芯片架构复杂，包含大量的晶体管和复杂的技术单元，编译器需对这些硬件特性进行优化，同时要深度协同芯片架构，例如，编译器必须理解芯片的流水线结构、指令集扩展等特性。

“还难在生态上。”

一位业内人士表示，英伟达的上层架构、谷歌的架构非常成熟，后来者只做差异化即可，数据流架构则没有现成编译生态可复用。

举个例子，当前程序员常用的开发工具是Python，如果一款新芯片无法兼容主流开发工具，会大大降低程序员对该芯片的使用效率。

谢炎告诉21记者，从设计之初，马赫芯片就在做编译器的开发工作，流片前已跑通很多模型；为期3个月的封闭开发，就为迭代版本，更好发挥芯片性能。

最终，马赫M100单颗芯片算力，达到1280 TOPS。

“你不会知道最佳性能点到底在哪，只能不断逼近。‘跑通’跟‘跑到最好’距离非常大。”

谢炎说，用马赫芯片跑VLA模型时，其性能已是Thor U的三倍，内部依然感觉有潜力可挖。

塞进大模型

2025年上半年，编译器正封闭开发，基座模型团队启动一项重要工作——把大语言模型塞进马赫M100芯片里。

此前，他们重新定义Thor U芯片的VLA智驾模型时，发现一个痛点：即便搭载第一梯队的车载芯片，大模型的运行性能仍大幅缩水。

这一问题根源，来自行业长期割裂的研发模式：

过去，芯片工程师埋头追求更高的峰值算力，算法工程师则疯狂堆叠模型参数、训练数据，完全不考虑芯片带宽、功耗等硬件约束。两者在各自的轨道上狂奔。

“总是想着模型参数量越大，把部署在车端的硬件算力提高即可，后来发现此路不通。”

一位参与模型研发的芯片工程师向《21汽车·一见Auto》回忆，若沿着“堆料”的老路，永远只能跟在别人身后“吃灰”。

团队意识到，真正解法，必须重构底层研发逻辑：把云端的超大模型塞进芯片里，在模型设计之初就考虑到硬件能力。

“先算硬件瓶颈，再设计模型。”上述人士总结。最后，他们提出一套可量化、可预测的软硬协同数学框架。

今年3月，理想汽车联合国创决策智能技术研究，以“软硬协同设计定律”为名将其正式发布。

该定律搭建起统一数学逻辑，将芯片物理特性和算法的计算需求，都“翻译”成数学语言：只需要输入芯片硬件参数、模型性能目标，公式自动输出最优的软硬配比方案。

谢炎说，芯片设计前期，必须要理解透彻模型端的需求。

“选对架构，并不会让芯片研发的速度变快。”他表示，团队的一个共识在于：芯片并非芯片团队孤立设计，而是跟模型团队、自动驾驶团队一起设计。

“没有他们的输入与认知，没有大家一起坐下来分析，就会做偏，带来时间的浪费。”谢炎评论，在他以前的工作经历中，“没有看到过这种高密度、跨部门的协同”。

VLA，是塑造理想AI的“决策大脑”。

2025年春节过后，李想认为，理想VLA一定要用自研的基座，可打通视觉感知、语言理解、车辆动作决策、座舱交互、高阶智驾、车身控制共用一套认知体系，就让基座模型团队和自动驾驶团队一起联合开发。

那年5月，理想发布车端VLA模型——MindVLA，基座模型团队开始转向VLA框架的前瞻性预研。

团队负责人陈伟回忆，当时共有200人，他们专门抽调3—4名核心人员，启动下一代VLA研发架构的开发，很快就锁定攻坚重点——视觉编码器。

突破下一代

下一代VLA架构，应该怎么搭？

一开始，团队并没有思路，他们从VLA版本的场景痛点及待提升之处，去寻找突破点。

MindVLA上线后，有车主反馈，白天、晚上表现不一致，出现无诱因异常减速、动力响应滞后、提速乏力等问题。

团队复盘后发现，这来自传统视觉编码器的感知缺陷：模型仅能识别画面中的物体类别，无法精准获取障碍物的空间深度、距离参数，误判空间位置，引发车辆决策异常。

为突破硬件与传统算法的双重限制，团队商议出全新思路：

直接用RGB纯视觉摄像头（通过红R、绿G、蓝B三原色通道采集环境反射光，输出彩色二维画面）采集数据，摄像头对空间位置、空间深度都能有准确的理解。

一开始，他们面向2D图像构建一套视觉编码器，将其取名2D ViT，较之通用编码器SigLip，其能以更小模型尺寸，以更快速度实现更好效果。

预研设计落地后，陈伟随即汇报给李想。

国庆假期后，理想的秋季战略会召开。据一位参会人士称，李想在会上“大谈特谈”基座模型团队做的这套方案。

其后，团队又引入X、Y、Z的空间三维坐标系，将视觉编码方案升级为3D ViT，其能表征空间深度的3D ViT（三维视觉Transformer）。

“我们测试过，在空间感知精度上，纯视觉保持激光雷达95%的精度，很好地弥补激光雷达探测距离不远的缺点。”

一名参与设计的工程师告诉《21汽车·一见Auto》，3D ViT立体视觉编码技术，还能用于机器人的研发中，“空间距离判断，在机器人同物理世界的交互中非常重要”。

今年1月，詹锟接手基座模型团队，他认为，激光雷达仍具备安全兜底价值，只是，不再适合作为前融合主传感器，其存在探测距离、延迟等物理短板，纯视觉后续会成主力感知方案。

詹锟

他预告，理想汽车下半年会做两件事：

第一，用纯视觉提高帧率，把芯片性能发挥到更大程度，大幅提升反应速度；第二，激光雷达会承担很重要的数据采集环节。

“想要催生颠覆性创新，得先打破原来的边界，而不是follow别人的路线。”这是谢炎在理想科技日说的一句话。

All in AI后，理想也如此。

自研芯片上，一众车企跟随英伟达路线，只有理想选择动态数据流架构；行业争相复刻端到端+VLA方案，理想切换重心，攻坚VLA基座。

这样非共识的抉择，都有几分“赌”的特性：赌自己找到一条细分赛道，赌自己能跑通。

赌对了，是独一份的先发优势与长期增长的底气；赌错了，是无人兜底的试错代价与市场阵痛，且如果再想重新打牌，难度就大了。

无论对错，理想都要承担起选择的重量。

（原文题为《理想做AI的六年：一场不跟风的赌局》，来源“一见Auto”，本文有删减）

文中部分图片来自理想汽车

若对文章内容有建议或异议，请联系编辑部。

办公电话：020 87399753