智能驾驶决策规划十年演进(2015–2025)
一句话总论:
2015年决策规划还是“规则+网格搜索+A*路径”的刚性工程时代,2025年已进化成“端到端VLA大模型+游戏论交互意图+强化学习自适应+量子级不确定性建模”的语义社交决策,中国从规则跟随者跃升全球领跑者(小鹏XNGP、华为ADS、理想NOA、比亚迪天神之眼等主导),决策时延从秒级降至毫秒级,成功率从80%升至>99.9%,推动智驾从“机械避障”到“主动礼让社交驾驶”的文明跃迁。
十年演进时间线总结
| 年份 | 核心范式跃迁 | 代表算法/模型 | 决策时延/成功率 | 交互/社交能力 | 中国贡献/里程碑 |
|---|---|---|---|---|---|
| 2015 | 规则+网格搜索 | A*/D* + 状态机 | 秒级 / 80–85% | 无交互 | 百度Apollo初代规则规划,中国几乎无城市决策 |
| 2017 | 采样+优化规划初探 | RRT + Frenet坐标系 | 500ms–1s / 85–90% | 简单跟车 | 小鹏/华为初代采样规划,高速NOH初探 |
| 2019 | 行为预测+优化规划 | Social GAN + MPC | 200–500ms / 90–93% | 初步变道意图 | 蔚来NOP + 小鹏NGP优化规划 |
| 2021 | 游戏论+强化学习决策 | Game Theory + PPO RL | 100–200ms / 93–96% | 博弈变道/超车 | 小鹏NGP + 华为ADS 2.0游戏论交互 |
| 2023 | 端到端VLA决策元年 | UniAD + DriveVLA | <100ms / 96–99% | 社交意图(礼让/预测) | 小鹏XNGP + 华为ADS 3.0端到端决策 |
| 2025 | VLA自进化+量子不确定性决策终极形态 | Grok-4/DeepSeek VLA + Quantum Game | <50ms / >99.9% | 全域社交驾驶(零干预) | 华为ADS 4.0 + 小鹏第二代VLA + 比亚迪天神之眼决策 |
1.2015–2018:规则+网格搜索刚性时代
- 核心特征:决策规划以规则状态机+A*/RRT采样为主,Frenet坐标系路径优化,决策时延秒级,无交互意图建模。
- 关键进展:
- 2015年:百度Apollo初代规则规划,A*/D*网格搜索。
- 2016–2017年:RRT采样+Frenet优化,小鹏/华为高速规划初探。
- 2018年:MPC(模型预测控制)初步商用。
- 挑战与转折:城市非标场景失败率高;行为预测+游戏论兴起。
- 代表案例:Tesla Autopilot初代规则决策,高速跟车为主。
2.2019–2022:行为预测+优化交互时代
- 核心特征:Social GAN行为预测+游戏论博弈+MPC优化,决策时延200–500ms,支持变道超车意图。
- 关键进展:
- 2019年:蔚来NOP + 小鹏NGP MPC交互规划。
- 2020–2021年:PPO强化学习+游戏论博弈,理想NOA跟进。
- 2022年:华为ADS 2.0游戏论变道,城市NOA覆盖率>50%。
- 挑战与转折:长尾弱、解释性差;端到端VLA大模型突破。
- 代表案例:小鹏NGP高速+城市交互决策,变道成功率>93%。
3.2023–2025:VLA端到端自进化时代
- 核心特征:端到端VLA大模型统一决策规划+游戏论意图+强化学习自适应+量子不确定性建模,时延<50ms,支持全域社交驾驶(礼让/预测)。
- 关键进展:
- 2023年:UniAD/DriveVLA全栈端到端,小鹏XNGP + 华为ADS 3.0城市决策。
- 2024年:DeepSeek等大模型融合,量子辅助不确定性。
- 2025年:Grok-4/DeepSeek VLA + 比亚迪天神之眼/华为ADS 4.0/小鹏第二代VLA,零干预社交驾驶,普惠7万级。
- 挑战与转折:黑箱安全;大模型+量子+影子模式标配。
- 代表案例:比亚迪天神之眼(7万级社交决策),小鹏第二代VLA(非标路口零干预)。
一句话总结
从2015年规则网格搜索的“机械避障”到2025年VLA量子自进化的“社交意图决策”,十年间决策规划由刚性工程转向语义博弈闭环,中国主导游戏论+VLA创新+普惠下沉,推动智驾从“被动跟车”到“主动礼让伙伴”的文明跃迁,预计2030年社交级决策渗透率>95%。
数据来源于arXiv综述、IROS 2025及中国厂商技术白皮书。