引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!

3D视觉工坊 2025-11-26 07:00

来源:深蓝AI

过去十年,自动驾驶研究可谓风起云涌——从最初的感知与定位,到如今的端到端驾驶与规划决策,技术体系已经从“能看懂路”逐步走向“能自己开”。

这一路上,计算机视觉、传感器融合、轨迹预测、行为建模、规划控制、强化学习等方向齐头并进,形成了一个完整而庞大的智能驾驶生态。

为了帮助读者快速了解这一领域的发展脉络,我们精选了十篇在过去十余年中引用量高、影响力大、代表性强的关键论文。

这十篇论文几乎串联起了自动驾驶学术研究的主线,无论你是刚入门的学习者,还是希望重新梳理自动驾驶研究脉络的从业者,相信这份“十篇必读”都能帮你快速建立起对整个领域的全景认知

1
高引必读文章盘点
(排名不分先后)

Are we ready for Autonomous Driving? The KITTI Vision Benchmark Suite

📈 引用量:18,995

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图2

1KITTI数据集自动驾驶的感知、SLAM、深度估计等研究奠定了实验基础,是自动驾驶研究名副其实的“起点之一

nuScenes: A Multimodal Dataset for Autonomous Driving

📈 引用量:8819

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图3

2nuScenes同时包含六个方向的摄像头图像、激光雷达点云、雷达回波以及人工标注的语义地图。最下方是由人工撰写的场景描述,体现了该数据集在视觉、几何与语义层面的完整性

Scalability in Perception for Autonomous Driving: Waymo Open Dataset

📈 引用量:4432

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图4

3展示了 Waymo Open Dataset 中的激光雷达标注示例:黄色表示车辆、红色为行人、蓝色为交通标志、粉色为骑行者。精细的多类别标注和高密度点云信息,使其成为验证自动驾驶感知算法性能的黄金标准

后台私信1124,领取10篇自动驾驶高引论文包。

CARLA: An Open Urban Driving Simulator

📈 引用量:8473

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图5

4展示了 CARLA 场景在不同天气下的效果:从晴朗白天到雨后湿地、再到傍晚夕阳。多样的光照与气候变化,体现了该平台支持的高自由度环境控制,也验证了它在多场景鲁棒性研究中的重要价值

Deep Reinforcement Learning for Autonomous Driving: A Survey

📈 引用量:3036

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图6

5展示了现代自动驾驶系统的主要组成模块:从场景理解(感知)、到决策与规划,再到执行控制。强化学习在其中的角色,是让整个系统通过“试错与反馈”不断优化决策策略,从而实现端到端的自我学习驾驶智能

Multi-View 3D Object Detection Network for Autonomous Driving

📈 引用量:4271

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图7

6图展示了 MV3D 的整体结构:网络同时接收激光雷达的鸟瞰图、前视图以及相机图像输入,先从 BEV 图中生成 3D 物体候选框,再将这些候选区域投影到不同视角,通过深度融合网络整合多模态特征,最终完成类别识别与方向感知的 3D 框回归

后台私信1124,领取10篇自动驾驶高引论文包。

DeepDriving: Learning Affordance for Direct Perception in Autonomous Driving

📈 引用量:2636

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图8

7图展示了论文提出的可供性表示方式:系统在车道线系统与标记系统之间建模“可行区域”,通过重叠区实现平滑换道。这样的抽象让模型能够从复杂的视觉输入中提炼出对驾驶最关键的几何与语义信息,实现自然且连贯的驾驶控制

Object Scene Flow for Autonomous Vehicles

📈 引用量:2925

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图9

8展示了该论文提出的场景流估计效果:从上到下依次为动态物体分割结果(背景透明)、估计的三维运动流场,以及对应的真值流场。可以看到,模型不仅区分出独立运动的目标,还精确捕捉了各物体的三维位移方向

BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

📈 引用量:2018

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图10

9展示了 BEVFormer 的核心思想:系统以多摄像头图像为输入,利用「空间注意力」聚合各视角的关键区域特征,并通过「时间注意力」与上一时刻的 BEV 表征进行融合。这样的设计让网络能够像“记忆”一样理解场景变化,实现稳定的时空感知

Planning-oriented Autonomous Driving

📈 引用量:1103

引用量5w+!自动驾驶领域最硬核的10篇论文,建议收藏!图11

10下图展示了自动驾驶系统架构的演变:(a) 传统工业方案中,各模块独立运行;(b) 多任务学习框架共享 backbone 但仍分离决策;(c.1–c.2) 早期端到端方案仅优化部分组件;(c.3) UniAD 则主张以规划为核心,重新组织前序任务,使整个系统协同指向驾驶决策目标——真正实现“规划导向”的自动驾驶架构

后台私信1124,领取10篇自动驾驶高引论文包。

2
总结

回望这些年的研究进程,可以发现自动驾驶技术正经历从“感知驱动”向“决策驱动”的转变。从早期依赖规则与几何,到如今结合 Transformer、大模型和端到端规划,研究的重点正逐渐转向系统协同、泛化能力和安全验证。未来的自动驾驶,或许不再只是“让车自己跑”,而是让系统能像人一样理解场景、推理意图、做出合理的决策。

无论是感知层的精确度,还是决策层的智能化,这些经典论文都曾为今天的突破铺路。它们的思想与框架仍在被不断延伸、重塑,也正构成下一代智能驾驶系统的知识基石

编辑|阿豹

审编|阿蓝

本文仅做学术分享,如有侵权,请联系删文。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
more
峰飞航空发布eVTOL零碳水上机场
《计测技术》推荐文章|航空工业计量所樊哲:低空飞行器导航系统测试技术发展现状与趋势
“十五五”规划建议全文公布:加快新能源、新材料、航空航天、低空经济等战略性新兴产业集群发展;加强低空等新兴领域国家安全能力建设
六部门发文:有序扩大低空旅游、航空运动、私人飞行、消费级无人机等低空消费供给,支持有条件的地方建设航空飞行营地
新兴航空技术变革的10个方向(下)
波兰航空将收购捷克航空
波音扩大787产能,似与A350竞争获胜
SpaceX 升级版 “星舰” 测试期间发生爆炸
全球航空MRO数字化市场年增13.4%:从效率革命到体系重构的产业拐点
中东首秀!联合飞机镧影R6000闪耀迪拜航展,开启低空交通新纪元
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号