

作者丨梁辰
如果要选出最早凭借座舱功能占领用户心智的一家造车新势力,答案或许是理想。
“冰箱彩电大沙发”是理想最被人所知的卖点。但抛开这些精准的硬件定义,作为未来用户智驾空间与娱乐的第三空间,座舱里只有这些是远远不够的。智能化尤其是座舱空间的智能化,已经成为车企的核心卖点。
2023年5月,理想汽车智能空间副总裁勾晓菲曾在美国硅谷的一次半公开宣讲会上说,“触控不是座舱最主要的交互方式,把触控做得再好,生态做得再好,它不适合在这个终端里。基于触控生态的车机系统,就是在用正确的方式回答了一个错误的问题。”
勾晓菲这句话说完后的一个月,理想汽车推出了自研认知大模型“Mind GPT”,并将其以“理想同学”App的形式嵌入车机系统中,成为座舱里众多用户与数字内容交互的“新按钮”。
大模型加速上车后,智能座舱的竞争更显白热化。作为全公司最大的产品经理,李想对于AI的投入非常坚决,每个月都会参加数场AI的主题会。
他经常说的一句话是:“我们是一个AI公司,我们必须把大模型做出来,没有大模型就不配称为AI公司。”
李想不是技术科班出身,但在2024年6月,他做了一件非常具有“预言性”的事情:大模型的研究重心,要从预训练向后训练迁移。三个月后,OpenAI o1惊艳世人,后训练(Post-Training) 在大模型端到端训练中的话题度不断提升。而在李想此前的授意下,理想已经提前进行了内部共识和组织的切换。
效率,是理想智能化超车的重要保障。
回顾历史,在2021年2月全面自研之前,理想的语音助手还需要依赖思必驰、地平线、大象声科等供应商来支撑,甚至“用户数据”都还握在别人手中。从传统的AI助手到大模型时代下的智能体,理想通过“理想同学”,实现了一次座舱“自我革命”的重建。
摆脱供应商,组建初始团队
2020年,在交付一万辆车一个月后,理想汽车在美股上市。理想希望通过建立和完善自研能力,尽快追赶上竞争对手小鹏。然而,理想汽车内部算法团队和供应商的博弈中处于劣势。这让李想敏感地意识到,如果没有自研能力,就会一直被牵制。
全面启动自研之前,理想的座舱技术“一穷二白”,更多依赖供应商,例如思必驰的语音识别、大象声科的听觉算法、虹软的视觉能力等等。座舱方面还没有明确的路线图,团队如何建设、产品如何定义、技术路线怎么走,没有一个清晰的结论。
语音助手自研的任务,落在了座舱部门的空间AI团队身上。
2021年底,李想在智能空间大部门的战略会上,明确智能空间与AI相关的全部算法都要自研,之前底层算法依赖于供应商的局面必须被打破。与此同时,理想内部正在力推两件事情:一个是IPD流程,将所有人的工作绑定在流程上;二是推动研发平台的建设。
理想的座舱平台化策略是通过SS1、SS2、SS3、SS4等不同平台来实现,每个平台基本上对应一款车型。由于理想的车型设计相似,结构上也相对可控。对于研发团队而言,最具挑战性的是麦克风和摄像头传感器的布局,这些布局直接影响算法的开发。因此,标准化的配置单,只会有“一份菜单”,避免了定制化的资源消耗。
原本,勾晓菲规划用两年时间完成自研,但这将会落后于理想新车的发布节奏。

(勾晓菲)
2022年,理想汽车计划只发布一款L9,到2023年L9、L8、L7系列车型同时上市。如果两年后才切回自研,理想可能会错失市场机会。在无法预知蔚来、小鹏、华为等对手迭代速度的情况下,切换供应商的进程被缩短到了一年。
2022年的前半年内,从搜狗加入的陈伟负责组建空间AI团队,成员既有来自搜狗的老同事,也有百度、快手、字节、阿里达摩院等互联网大厂成员。
与搜狗等互联网公司相比,理想仍没脱离车企的“草莽”气质——没有架设云端服务器,甚至连基本的工作站也没有,用户的数据全在语音技术供应商思必驰手中。
团队要做的第一件事,就是将数据所有权拿回,并在公司内部架设服务器,开始自己存储数据。
与此同时,由于成员背景多元,团队需要明确未来的发展方向,迅速提升这支团队的战斗力,只能专注于主线任务。有座舱AI同事张江回忆:“我们得到的目标是全力专注于自研,效果要比供应商好30%。”
其次,在团队没有成型时,空间AI团队全部实行扁平化管理,确保信息沟通足够迅速。要打破从大厂可能带来的部门墙思维,通过流程和制度的变化来解决协作问题,让更多人快速融入团队。
理想所有的高层,都对座舱的推进保持了高度关注。座舱自研之初,空间AI团队设想的一种发展路径是,未来一到两年内,让理想同学的AI能力可以覆盖车、门店、客服等等场景。
但据另一位理想座舱员工孙浩回忆,有一次李想参加了座舱团队的LSA战略分析会。会后,李想给了一个结论:不要把目前已经成熟的方案重做一遍。
“智能客服这种事,值不值得做,如果你能花钱买过来,你就去买,你不要再让团队再去支撑这样业务。我们这个团队是把理想同学的产品力度做好,解决车内交互的问题。”
空间AI团队的任务变得更加聚焦——做好“理想同学”。
完成资源切换后,成果很快显现。与供应商方案相比,自研技术的车内表现有了实质性的突破,用户能感受到语音控制的便捷性得到了显著提升,交互体验变得更流畅自然。
2022年11月,空间AI团队首次在理想ONE车型上完成了自研语音的落地。
等到理想L7首发的时候,搭载其上的语音和视觉功能已经全部是自研技术。2023年上半年,理想基本完成了座舱自研技术的切换,彻底摆脱对外部供应商的依赖。
ChatGPT来了
2022年底,科技圈最大的一件事是,ChatGPT来了。
理想座舱团队此前进行了一些预训练工作,对大模型的到来有预判,但没想到模型能发展到如此大的规模。当时,座舱的自研技术切换还没有完成,OpenAI还是实行闭源,没有人知道大模型应该怎么做。
在大模型出现前,语音交互主要是命令式或任务型的,行业竞争更多集中在语音识别的速度、执行的准确性和响应效率上。但那时候的AI助手认知能力仍然不足,尤其在复杂任务理解、知识问答、开放式对话上存在局限,这也制约了理想同学的产品力。
李想把座舱团队的高管叫上开会,他给了一个自己的结论:ChatGPT对产业影响是摧枯拉朽的,所有人都在关注AI助手的语音识别速度、灵敏度和准确率,但这种东西永远卷不出来。从用户体验的角度来看,没有大模型的加持,这些指标只是低维度的竞争。
李想说,“AI助手的核心问题就是‘笨’,不做大模型怎么解决笨的问题?”
从这个时候开始,AI成为李想提及最高频的词之一。两个月后,理想对内宣布,理想的愿景是“2030年,成为全球领先的人工智能企业”。虽然这一愿景后续有所变化,但理想汽车已经不再局限于“车企”的定位。
此时,大模型与座舱空间如何结合、解决什么问题,没有任何可参考的样本,需要座舱团队自己从头摸索。
可这不影响李想对大模型坚决的态度,他甚至要求下属们参与“对赌”,还要讲明白可以如何利用大模型满足用户,以及明确的交付时间点。
最终,理想座舱团队提出了一个大模型上车的路线图。
当时,所有人都没有完全清楚这应该被称为“智能体”,但团队已经认为大模型是一种形态——作为大脑,可以连接各种工具和记忆、行动的组件。
2023年4月,座舱团队向李想进行了一次汇报,并为它起好了名字--Mind GPT。两个月之后,理想的空间AI团队就交出了第一个版本——6月7日,家庭科技日活动上,李想对外证实了大模型MindGPT的存在。
代表理想进行分享的是空间AI负责人陈伟。

(陈伟)
他表示,Mind GPT使用了1.3万亿token,进行基座模型训练,这相当于它具备了人类高质量知识的总和。当时,理想已经基本确定了场景,主要集中在出行娱乐、用车以及儿童教育,仍然是围绕家庭用户的需求做文章。
这些需求在内部被称为“三助一师”,涵盖了用户用车助手、出行助手、娱乐助手及百科老师四个角色,理想甚至为这个新名词注册了多个商标。
后来,空间AI团队又定下了2023年底大模型上车的新目标。整个团队不仅要完成从0到1的大模型全链路技术突破,更要从0到1完成将大模型赋能给理想同学。
留给空间AI团队的时间只有6个月,这个目标的难度非常大。
过去,空间AI团队成员主要擅长开发功能单一、目标明确的小模型,现在却要转向研发功能复杂、需求不断升级的大模型,并最终部署到汽车上,这本身就极具挑战。更何况,当时的开源资源并不充足。
大模型时代不仅技术门槛高,其协作方式也发生了根本变化。整个研发流程涉及预训练、后训练、评估等多个环节,需要训练、数据、底层工程等多方面能力的紧密协作,如何合理切割阶段成为关键,切得太细协作低效,太粗人力不足传统的“击鼓传花”式研发逻辑,每增加环节就导致效率下降和不可控性的上升。
这意味着,座舱AI团队需要围绕大模型重新定义关键岗位和角色,摒弃过去习惯的传统互联网大厂研发路径,在同时推进大模型基座、训练算法研发的同时,确保产品在各类车载场景下的体验。
这不仅要解决算法的准确性问题,还需兼顾工程的执行效率等现实因素。
几乎每周,理想都会对Mind GPT进行一次版本迭代,并同步集成到“理想同学”中进行升级,涉及与已有模块的联动和新策略的联调。为了确保每次升级都能带来体验稳定提升,上线之前团队都需要进行人工标注和测试验证。
据理想座舱团队的张栋回忆,“李想是一个非常愿意给资源的人。2023年,李想经常要求座舱AI团队大胆提出资源或者算力的需求。预算上直接批了三四千张卡(芯片)的资源,团队累计拥有近八千张卡。”
事实上,自研意味着要工作始终比行业快半步,甚至是一步。
2023年9月,座舱AI团队还推出“方言自由说”功能。更令团队感到兴奋的是,多模态互动的落地,让手势控制进入座舱成为可能。在车内,用户只需随手一指,就能轻松控制车窗、空调、灯光甚至影音娱乐。
2023年底,Mind GPT随着OTA 5.0版本更新成功“上车”,并通过国家大模型备案,是较早实际应用于车端的大语言模型之一。在Mind GPT加持之下,理想同学能够理解更为复杂的功能组合,用户交互更自然。
通向未来的AI世界
2024年1月,理想成立了AI委员会,由谢炎负责。
这个委员会里,包括产品部和各个研发部门的负责人及主要人员,目的是对未来的技术路线进行评审和判断,以及对技术投资进行决策。
比如,决定是否在某个项目上立项。理想有一个面向研究的RD预算池,这个池子的资金分配,很大程度上就由技术委员会进行技术评审。
2024春季发布会上,理想推出首款纯电车型MEGA;一个月后,公司启动组织升级,CEO办公室改名“产品与战略群组”,设立产品线和质量运营两个新部门。
这些变化都只为了AGI(通用人工智能)进入李想认为的“iPhone 4时刻”。
李想曾将OpenAI定义的聊天机器人认为是第一阶段,第二阶段是推理者,而进入上述时刻的第三阶段是出现Agent,理想要做的就是将汽车作为载体实现AGI的Agent阶段。
这也意味着,理想需要突破更底层的技术。
2024年10月,理想秋季战略会上,车机端的理想同学的业务优先级由最高降低两级,陈伟在2025年初被调任基座模型部门负责人,主导基座模型自研。
基座模型是蔚小理等新势力争夺AI时代的一张门票。今年4月,小鹏智驾负责人李力耘曾表示,小鹏目前已经着手推进72B超大规模参数世界基座模型的研发。
理想也不甘人后。今年3月,理想在英伟达2025春季GTC大会上宣布,在车端部署了参数为 22 亿的 MindVLA 大模型(Vision-Language-Action Model,视觉-语言-动作模型)。
据基座团队向雷峰网反馈,内部不会追求一个超大规模的基座,要结合投入产出比以及场景结合度。(后续,雷峰网还将推出理想端到端、基座模型、芯片等自研话题,感兴趣的读者可添加编辑微信 Gru1993 互通有无)
过去的三年时间里,承担理想基础性技术研发工作的人是理想CTO谢炎。
加入理想前,谢炎曾在华为工作三年,期间升任消费者BG软件部副总裁、终端OS部部长,他还曾作为AliOS首席架构师在阿里巴巴工作五年。与更侧重产品的勾晓菲不同,谢炎将精力主要放在基础设施和底层技术的研发上。
谢炎曾对他人表示,自己70%的时间都在操作系统和自研芯片。
2025年4月16日,理想汽车正式宣布开源理想星环OS,成为全球首家开源整车操作系统的车企。李想在微博上表示,开源的理想星环OS可以帮助任何一个品牌每年节省千万甚至上亿的成本。
目前来看,理想要重点打造两款人工智能产品,理想同学用以实现Agent和自动驾驶用以实现L4级别的自动驾驶,并且基座模型发展到最后阶段会融合成VLA模型。因此,基座模型被理想高层寄予了更高的期待。
在李想看来,车将从工业时代的交通工具,进化成为AI时代的空间机器人。
从2021年决定自研起,从智能驾驶到理想同学,所有的一切工作都是指向了未来的AI世界。
注:文中的张江、孙浩、张栋等皆为化名。
