本文字数:3958|预计6分钟读完
自有主张,另寻解法。
记者丨易思琳 吴晓宇
编辑丨吴晓宇
2026年北京车展期间,理想汽车CEO李想组织了一场老友饭局。
当天,他与几位出走的高管们重聚餐桌,在场的有前总裁沈亚楠、前智驾预研负责人贾鹏、前智驾量产研发负责人王佳佳、前第二产品线负责人张骁,还有前智驾产品总监赵哲伦。
这些人,分别创立赫宇机器人、至简动力、斜跃智能、维他动力,有的专注于机器人,也有主攻机器狗。彼此调侃,这是一场“车人狗聚会”。
“车人狗聚会”,来源:贾鹏朋友圈
寒暄之外,几位离职高管向李想提了一个共性诉求:马赫M100能不能也向他们供应?
马赫M100,单颗芯片算力为1280 TOPS,领跑业内,也是全球唯一采用动态数据流架构的智驾芯片,其能减少缓存中的反复存取,提高AI运行效率。
“外采其他家的芯片,从工具链、稳定性,再到效率、成本,都不如马赫M100芯片。”李想在播客里说,那些老友清楚其自研芯片的水平。
自2022年开始,理想四年攻坚芯片,四年重构操作系统,三年打磨大模型,搭起一套具身智能体系,其在慢慢兑现李想的野心——成为一家人工智能的生态公司。
1
下注“数据流”
李想自研芯片的想法,萌生于2021年全球芯片荒。
彼时,芯片交货周期由30天拉长到6个月,单颗芯片价格暴涨5-10倍,头部车企拿走大半的芯片产能,留给新势力的就非常有限,供应链被卡了脖子。
2022年7月,李想从华为引入谢炎,将芯片、操作系统等统归到谢主管的系统与计算群组之下,正式组建芯片团队。
谢炎刚加入时,理想芯片团队只有两人,不到一个月又走一人。
“资源有限,是不是要先做小芯片试水?”剩下的那名员工问他。小芯片是指低成本、低算力的AI芯片,用于试错、验证基础能力。
一开始,谢炎明确反对做小芯片。
“我和李想有一个非常一致的意见:自研不是为证明自己有能力做,得真正解决问题。”
谢炎在采访现场告诉《21汽车·一见Auto》,团队很明确,车内AI算力的要求将越来越高,外购高端芯片的成本也越来越高,必须要着眼未来,如果自研做不到比外购更好,那做的意义不大。
理想汽车CTO谢炎
2022年11月,自研芯片在理想内部立项,团队规模10人左右。
当时,量产车上普遍搭载英伟达的Orin芯片,算力更大的Thor芯片还在研发中。经过半年分析,团队给自研设定了目标:一半成本、两倍性能,合计四倍效能。
谢炎清楚,这样的设定,延续英伟达的技术路线行不通。
“英伟达比你早启动几十年,积累比你深,资源比你多几个数量级。”他打比方,就像跟博尔特在100米赛道上,他又早跑2秒,不可能超过。
最终,理想选择动态数据流架构。
传统CPU/GPU芯片采用的是指令驱动,按照“先取指令,再取数据,再执行”的逻辑;而数据流架构,则是数据到齐之后立刻执行,执行完直接传给下一个单元,数据自己决定什么时候计算,不用 CPU/GPU 指挥。
这样一来,相比传统GPU架构,数据流架构能减少缓存中的反复存取,释放更多有效算力。
直到2026年,选择此架构设计智驾芯片的车企,只有理想,大家回避,核心顾虑有三:
其一,生态要从零搭建,自研编译器、调度器、模型映射工具链都要重做;其二,通用适配能力薄弱,此架构仅擅长规则化、标准化的AI运算,应对实时路况容错性不足;其三,芯片研发周期长,一旦新方向不对,近10亿元将成泡沫。
为什么理想敢押注小众架构?
“过去,数据流架构没发展起来,在于计算规模、数据规模不够大。”
谢炎解释称,当计算、数据规模大到一定程度,传统冯·诺依曼架构要扩展,额外代价会更高、效率更低,单一形态的、全新的计算架构完全有机会。
“采用动态数据流架构,没有赌的成分。”李想后来公开解释,团队手敲140万字的资料,来验证可行性。
2
死磕编译器
首款芯片于2024年流片,起初名字叫“舒马赫”,2025年改名为“马赫”。
“马赫是速度计量单位,代表速度快。我们做的是芯片,希望AI计算速度更快。”一位理想芯片团队人士向21记者解释称。
2025年,马赫芯片回片验证。
那一年,芯片团队的工作重心,从硬件调试转向为新的芯片开发编译器,同时做好芯片的改版和迭代,为量产上车做足准备。
《21汽车·一见Auto》独家获悉,当年3月,理想汽车召集算力单元部门进行封闭开发,为期3个月,核心就为了马赫芯片做编译器开发。
它是衔接硬件与算法的核心桥梁,能将程序员常用的编程语言,转换成芯片可识别、可执行的机器语言去执行。
“编译器要做的事,是给芯片做一套快速的适配接口,以快速地新算法部署在芯片上。”
一位行业人士向记者解释,芯片开发周期是3-5年,其更新节奏滞后于算法。芯片流片成功之后,得让它不停适应新算法,引入编译器,就能缩短开发周期、提高开发效率。
编译器研发的高门槛,源于硬件适配的复杂性。
芯片架构复杂,包含大量的晶体管和复杂的技术单元,编译器需对这些硬件特性进行优化,同时要深度协同芯片架构,例如,编译器必须理解芯片的流水线结构、指令集扩展等特性。
“还难在生态上。”
一位业内人士表示,英伟达的上层架构、谷歌的架构非常成熟,后来者只做差异化即可,数据流架构则没有现成编译生态可复用。
举个例子,当前程序员常用的开发工具是Python,如果一款新芯片无法兼容主流开发工具,会大大降低程序员对该芯片的使用效率。
谢炎告诉21记者,从设计之初,马赫芯片就在做编译器的开发工作,流片前已跑通很多模型;为期3个月的封闭开发,就为迭代版本,更好发挥芯片性能。
最终,马赫M100单颗芯片算力,达到1280 TOPS。
“你不会知道最佳性能点到底在哪,只能不断逼近。‘跑通’跟‘跑到最好’距离非常大。”
谢炎说,用马赫芯片跑VLA模型时,其性能已是Thor U的三倍,内部依然感觉有潜力可挖。
3
塞进大模型
2025年上半年,编译器正封闭开发,基座模型团队启动一项重要工作——把大语言模型塞进马赫M100芯片里。
此前,他们重新定义Thor U芯片的VLA智驾模型时,发现一个痛点:即便搭载第一梯队的车载芯片,大模型的运行性能仍大幅缩水。
这一问题根源,来自行业长期割裂的研发模式:
过去,芯片工程师埋头追求更高的峰值算力,算法工程师则疯狂堆叠模型参数、训练数据,完全不考虑芯片带宽、功耗等硬件约束。两者在各自的轨道上狂奔。
“总是想着模型参数量越大,把部署在车端的硬件算力提高即可,后来发现此路不通。”
一位参与模型研发的芯片工程师向《21汽车·一见Auto》回忆,若沿着“堆料”的老路,永远只能跟在别人身后“吃灰”。
团队意识到,真正解法,必须重构底层研发逻辑:把云端的超大模型塞进芯片里,在模型设计之初就考虑到硬件能力。
“先算硬件瓶颈,再设计模型。”上述人士总结。最后,他们提出一套可量化、可预测的软硬协同数学框架。
今年3月,理想汽车联合国创决策智能技术研究,以“软硬协同设计定律”为名将其正式发布。
该定律搭建起统一数学逻辑,将芯片物理特性和算法的计算需求,都“翻译”成数学语言:只需要输入芯片硬件参数、模型性能目标,公式自动输出最优的软硬配比方案。
谢炎说,芯片设计前期,必须要理解透彻模型端的需求。
“选对架构,并不会让芯片研发的速度变快。”他表示,团队的一个共识在于:芯片并非芯片团队孤立设计,而是跟模型团队、自动驾驶团队一起设计。
“没有他们的输入与认知,没有大家一起坐下来分析,就会做偏,带来时间的浪费。”谢炎评论,在他以前的工作经历中,“没有看到过这种高密度、跨部门的协同”。
VLA,是塑造理想AI的“决策大脑”。
2025年春节过后,李想认为,理想VLA一定要用自研的基座,可打通视觉感知、语言理解、车辆动作决策、座舱交互、高阶智驾、车身控制共用一套认知体系,就让基座模型团队和自动驾驶团队一起联合开发。
那年5月,理想发布车端VLA模型——MindVLA,基座模型团队开始转向VLA框架的前瞻性预研。
团队负责人陈伟回忆,当时共有200人,他们专门抽调3—4名核心人员,启动下一代VLA研发架构的开发,很快就锁定攻坚重点——视觉编码器。
4
突破下一代
下一代VLA架构,应该怎么搭?
一开始,团队并没有思路,他们从VLA版本的场景痛点及待提升之处,去寻找突破点。
MindVLA上线后,有车主反馈,白天、晚上表现不一致,出现无诱因异常减速、动力响应滞后、提速乏力等问题。
团队复盘后发现,这来自传统视觉编码器的感知缺陷:模型仅能识别画面中的物体类别,无法精准获取障碍物的空间深度、距离参数,误判空间位置,引发车辆决策异常。
为突破硬件与传统算法的双重限制,团队商议出全新思路:
直接用RGB纯视觉摄像头(通过红R、绿G、蓝B三原色通道采集环境反射光,输出彩色二维画面)采集数据,摄像头对空间位置、空间深度都能有准确的理解。
一开始,他们面向2D图像构建一套视觉编码器,将其取名2D ViT,较之通用编码器SigLip,其能以更小模型尺寸,以更快速度实现更好效果。
预研设计落地后,陈伟随即汇报给李想。
国庆假期后,理想的秋季战略会召开。据一位参会人士称,李想在会上“大谈特谈”基座模型团队做的这套方案。
其后,团队又引入X、Y、Z的空间三维坐标系,将视觉编码方案升级为3D ViT,其能表征空间深度的3D ViT(三维视觉Transformer)。
“我们测试过,在空间感知精度上,纯视觉保持激光雷达95%的精度,很好地弥补激光雷达探测距离不远的缺点。”
一名参与设计的工程师告诉《21汽车·一见Auto》,3D ViT立体视觉编码技术,还能用于机器人的研发中,“空间距离判断,在机器人同物理世界的交互中非常重要”。
今年1月,詹锟接手基座模型团队,他认为,激光雷达仍具备安全兜底价值,只是,不再适合作为前融合主传感器,其存在探测距离、延迟等物理短板,纯视觉后续会成主力感知方案。
詹锟
他预告,理想汽车下半年会做两件事:
第一,用纯视觉提高帧率,把芯片性能发挥到更大程度,大幅提升反应速度;第二,激光雷达会承担很重要的数据采集环节。
“想要催生颠覆性创新,得先打破原来的边界,而不是follow别人的路线。”这是谢炎在理想科技日说的一句话。
All in AI后,理想也如此。
自研芯片上,一众车企跟随英伟达路线,只有理想选择动态数据流架构;行业争相复刻端到端+VLA方案,理想切换重心,攻坚VLA基座。
这样非共识的抉择,都有几分“赌”的特性:赌自己找到一条细分赛道,赌自己能跑通。
赌对了,是独一份的先发优势与长期增长的底气;赌错了,是无人兜底的试错代价与市场阵痛,且如果再想重新打牌,难度就大了。
无论对错,理想都要承担起选择的重量。
(原文题为《理想做AI的六年:一场不跟风的赌局》,来源“一见Auto”,本文有删减)
文中部分图片来自理想汽车
若对文章内容有建议或异议,请联系编辑部。
办公电话:020 87399753