
华源证券: 《2025当自动驾驶与机器人共振,详解VLA与世界模型报告》
(完整版.pdf ) 以下仅展示部分内容 下载方式见文末
一、报告主题与核心观点
本报告系统分析了**视觉-语言-动作模型(VLA)**在自动驾驶与具身智能(以人形机器人为代表)中的演进路径、技术瓶颈与工程落地前景。核心观点认为:
VLA模型是自动驾驶从“功能实现”走向“类人体验”的关键技术范式,其本质是知识驱动对数据驱动的升维;
具身智能(如人形机器人)是自动驾驶的升维问题,但受限于数据采集、硬件标准化、仿真环境等多重挑战,仍处于早期探索阶段;
车端VLA落地前景明朗,机器人VLA尚需时间,二者在数据、算力、标准化等方面差异显著;
理想汽车与小鹏汽车在VLA模型部署与工程化方面进展领先,具备先发优势。
二、VLA模型的定义与演进逻辑
1. VLA模型的定义与结构
VLA(Vision-Language-Action)模型是多模态大模型的子集,融合视觉、语言、动作三种模态,具备从感知到决策再到执行的端到端能力;
典型架构包括:多模态编码器(视觉/语言输入)→ 大语言模型(推理与语义理解)→ 动作解码器(轨迹或控制指令输出);
代表模型包括:Waymo EMMA、Open Drive VLA、小米ORION、理想Mind VLA、Open VLA、Helix、ViLLA等。
2. 自动驾驶范式的演进路径
阶段一:规则驱动(模块化算法)→ 阶段二:数据驱动(端到端模仿学习)→ 阶段三:知识驱动(VLA模型+大语言模型);
知识驱动的核心优势:具备类人推理、泛化能力、解释性,能解决长尾场景、复杂博弈、极端工况等问题;
关键转折点:多模态大语言模型(LLM)引入,使模型具备“理解世界”的能力,推动从“第三人称智能”向“第一人称智能”跃迁。
三、VLA在自动驾驶中的工程落地挑战与解决方案
1. 核心矛盾:工程部署能力
模型层面:
3D空间理解:3D Gaussian Splatting(3D GS)成为获取高质量中间表征的关键技术;
长时序记忆:引入QT-Former、动态记忆模块、稀疏注意力机制解决长程规划问题;
计算效率:通过模型量化、MOE架构、投机推理等手段实现端侧部署;
训练层面:
世界模型构建仿真环境,实现闭环强化学习;
训练流程:行为克隆 → 逆强化学习 → 强化学习;
数据层面:
汽车场景结构单一、任务明确、数据标准化程度高,具备规模化采集优势;
世界模型可用于生成仿真数据,解决长尾场景不足问题。
2. 典型车端VLA架构
理想Mind VLA:六大关键技术(3D编码、MindGPT、Diffusion轨迹生成、RLHF、世界模型强化学习、端侧优化);
小米ORION:QT-Former实现长时序记忆,Bench2Drive闭环测试表现优异;
Waymo EMMA:首个端到端多模态模型,具备CoT推理能力,但部署受限;
Open Drive VLA:强化3D感知与车辆-环境交互,开环测试表现良好。
四、具身智能(人形机器人)是自动驾驶的升维问题
1. 技术瓶颈:数据闭环难以建立
任务复杂度更高:机器人需处理多场景、多任务、多模态交互,数据维度远高于汽车;
自由度极高:人形机器人可达40+自由度,数据采集、映射、控制难度极大;
硬件未标准化:本体构型、传感器配置、通信协议尚未统一,导致数据孤岛;
仿真环境要求高:需具备物理交互能力,当前仿真平台(如Isaac、DISCOVERSE)仍不成熟;
算力瓶颈:端侧芯片无专用方案,功耗、体积、散热限制严重。
2. 破局思路
标准化先行:统一本体构型、通信协议、传感器配置,建立可复用的数据体系;
模型闭环训练:实现端到端可训,引入世界模型+多模态数据(如触觉)提升物理交互能力;
数据策略:从互联网视频、人类演示、仿真数据中迁移学习,构建通用策略模型。
3. 典型机器人VLA架构
Open VLA:首个开源7B参数机器人VLA,支持消费级GPU部署,具备商业潜力;
Helix:首个双系统架构,支持200Hz连续控制,具备零样本泛化与多机器人协同能力;
ViLLA(智元GO-1):利用互联网视频+人类演示数据,实现小样本泛化与“一脑多形”适配。
五、投资建议与风险提示
1. 投资建议
推荐关注:理想汽车、小鹏汽车
核心逻辑:
理想汽车:已完成从整车企业向AI企业的战略转型,Mind VLA模型具备工程落地能力,预计2025年实现L3级自动驾驶;
小鹏汽车:坚持“底层自研、全链自主”,VLA-OL模型已上车,云端算力达10EFLOPS,图灵芯片即将量产。
2. 风险提示
技术路径未收敛,存在被颠覆风险;
汽车行业价格战加剧,销量不及预期;
宏观经济波动影响汽车与机器人消费。
六、总结性观点
VLA模型是下一代自动驾驶的核心范式,其知识驱动特性将重塑用户体验与产品定义;
具身智能是自动驾驶技术的自然延伸,但受限于数据、硬件、仿真等瓶颈,仍需中长期投入;
理想与小鹏在VLA模型的工程化落地方面具备领先优势,有望率先实现商业化闭环;
行业正处于“iPhone 4时刻”前夜,标准化、数据闭环、模型泛化能力将是未来的决胜点。







☟☟☟
☞人工智能产业链联盟筹备组征集公告☜
☝
精选报告推荐:
11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:
【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单?
【清华第七版】文科生零基础AI编程:快速提升想象力和实操能力
【清华第十一版】2025AI赋能教育:高考志愿填报工具使用指南
10份北京大学的DeepSeek教程
【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施
【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望
【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)
8份浙江大学的DeepSeek专题系列教程
浙江大学DeepSeek专题系列一--吴飞:DeepSeek-回望AI三大主义与加强通识教育
浙江大学DeepSeek专题系列二--陈文智:Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景
浙江大学DeepSeek专题系列三--孙凌云:DeepSeek:智能时代的全面到来和人机协作的新常态
浙江大学DeepSeek专题系列四--王则可:DeepSeek模型优势:算力、成本角度解读
浙江大学DeepSeek专题系列五--陈静远:语言解码双生花:人类经验与AI算法的镜像之旅
浙江大学DeepSeek专题系列六--吴超:走向数字社会:从Deepseek到群体智慧
浙江大学DeepSeek专题系列七--朱朝阳:DeepSeek之火,可以燎原
浙江大学DeepSeek专题系列八--陈建海:DeepSeek的本地化部署与AI通识教育之未来
4份51CTO的《DeepSeek入门宝典》
51CTO:《DeepSeek入门宝典》:第1册-技术解析篇
51CTO:《DeepSeek入门宝典》:第2册-开发实战篇
51CTO:《DeepSeek入门宝典》:第3册-行业应用篇
51CTO:《DeepSeek入门宝典》:第4册-个人使用篇
5份厦门大学的DeepSeek教程
【厦门大学第一版】DeepSeek大模型概念、技术与应用实践
【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇
10份浙江大学的DeepSeek公开课第二季专题系列教程
【精选报告】浙江大学公开课第二季:《DeepSeek技术溯源及前沿探索》(附PDF下载)
【精选报告】浙江大学公开课第二季:2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例(附PDF下载)
【精选报告】浙江大学公开课第二季:智能金融——AI驱动的金融变革(附PDF下载)
【精选报告】浙江大学公开课第二季:人工智能重塑科学与工程研究(附PDF下载)
【精选报告】浙江大学公开课第二季:生成式人工智能赋能智慧司法及相关思考(附PDF下载)
【精选报告】浙江大学公开课第二季:AI大模型如何破局传统医疗(附PDF下载)
【精选报告】浙江大学公开课第二季:2025年大模型:从单词接龙到行业落地报告(附PDF下载)
【精选报告】浙江大学公开课第二季:2025大小模型端云协同赋能人机交互报告(附PDF下载)
【精选报告】浙江大学公开课第二季:DeepSeek时代:让AI更懂中国文化的美与善(附PDF下载)
【精选报告】浙江大学公开课第二季:智能音乐生成:理解·反馈·融合(附PDF下载)
6份浙江大学的DeepSeek公开课第三季专题系列教程
【精选报告】浙江大学公开课第三季:走进海洋人工智能的未来(附PDF下载)
【精选报告】浙江大学公开课第三季:当艺术遇见AI:科艺融合的新探索(附PDF下载)
【精选报告】浙江大学公开课第三季:AI+BME,迈向智慧医疗健康——浙大的探索与实践(附PDF下载)
【精选报告】浙江大学公开课第三季:心理学与人工智能(附PDF下载)
资料下载方式
Download method of report materials

【中国风动漫】《雾山五行》大火,却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折!

如需获取更多报告
报告部分截图

编辑:Zero

文末福利
1.赠送800G人工智能资源。
获取方式:关注本公众号,回复“人工智能”。
2.「超级公开课NVIDIA专场」免费下载
获取方式:关注本公众号,回复“公开课”。
3.免费微信交流群:
人工智能行业研究报告分享群、
人工智能知识分享群、
智能机器人交流论坛、
人工智能厂家交流群、
AI产业链服务交流群、
STEAM创客教育交流群、
人工智能技术论坛、
人工智能未来发展论坛、
AI企业家交流俱乐部
雄安企业家交流俱乐部
细分领域交流群:
【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能&物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】
入群方式:关注本公众号,回复“入群”

