news 2026/4/16 9:50:48

RA-L‘26|港大先进院DPNet:首个多普勒激光雷达与运动规划器深度融合框架,高动态场景精准避障

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RA-L‘26|港大先进院DPNet:首个多普勒激光雷达与运动规划器深度融合框架,高动态场景精准避障

点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

作者:Zuo Wei(授权发布) | 来源:3D视觉工坊

「3D视觉从入门到精通」知识星球(点开有惊喜) !星球内有20多门3D视觉系统课程、3DGS独家系列视频讲解、顶会论文最新解读、海量3D视觉行业源码、项目承接、求职招聘等。想要入门3D视觉、做项目、搞科研,欢迎加入!

引言

机器人在高动态环境中的避障难题,一直是robotics领域的研究热点。近日,港大、中科院深圳等多机构联合提出DPNet,首次将多普勒激光雷达融入运动规划,破解这一痛点,相关成果已被IEEE Robotics and Automation Letters(RA-L)2026年4月正式录用。

0.论文信息

标题DPNet: Doppler LiDAR Motion Planning for Highly-Dynamic Environments

核心贡献:首个将多普勒激光雷达与运动规划器深度融合的框架(DPNet),通过多普勒模型学习实现高动态环境下的高频、高精度障碍物跟踪与运动规划,解决传统方法延迟高、精度低的痛点。

作者Wei Zuo, Zeyi Ren, Chengyang Li, Yikun Wang, Mingle Zhao, Shuai Wang, Wei Sui, Fei Gao, Yik-Chung Wu, Chengzhong Xu

机构:香港大学,中国科学院深圳先进技术研究院,澳门大学,地瓜机器人,浙江大学

原文链接:https://arxiv.org/abs/2512.00375

视频链接:https://www.bilibili.com/video/BV17MQvBxEUa?t=172.8

1.Motivation:为什么运动规划器在高动态场景下容易失效?

在自动驾驶、无人机避障等高动态场景中,障碍物(如高速行驶的车辆、突发移动的行人)运动速度快、轨迹多变,运动规划器需实时预判其未来位置才能提前避障。 传统方法依赖普通激光雷达(LiDAR),只能获取障碍物的空间位置,需通过多帧扫描、卡尔曼滤波等方式间接估计速度,不仅延迟高(无法及时响应突发障碍),精度也难以满足高动态场景需求,极易导致避障失败。

而多普勒激光雷达(Doppler LiDAR)的核心优势是——可直接获取障碍物的实时速度信息,无需间接估计,这为解决高动态避障难题提供了关键支撑。为此,作者团队提出DPNet,首次将这种传感器与运动规划器深度融合,打造全新规划范式。

2.DPNet两大核心模块分析

要实现“多普勒激光雷达+运动规划”的高效融合,DPNet设计了两大核心模块,分别解决“障碍物速度与位置预测”和“自身运动规划参数优化”两大关键问题,二者协同工作,实现高频、高精度规划。

DPNet整体框架:D-KalmanNet(左,负责障碍物轨迹预测)与DT-MPC(右,负责自身运动规划与参数优化)协同,实现高动态环境下的高效避障。

要理解Doppler LiDAR是如何被DPNet运用的,首先要了解它的原理(也就是和传统LiDAR的不同之处)。如下图所示,对于点云中的每一个扫描点,Doppler LiDAR除了提供传统的三维空间坐标(x,y,z),还提供了多普勒速度(Doppler velocity)测量。多普勒速度代表着扫描点实时线性速度(linear velocity)在扫描激光方向的分量,也就是径向速度。多普勒速度的正/负分别代表扫描点径向速度方向的离开(outgoing)/靠近(incoming)。

多普勒激光雷达的原理示意(左)和对环境中动态物体的感知展示(右)

基于这个原理,Doppler LiDAR能够做到对每一个扫描点的速度信息进行实时直接测量。目前,相关研究已经证明了它在SLAM、目标检测等领域的强大之处。本文介绍的DPNet,则是其在运动规划器领域的首次应用!

2.1.核心模块1:D-KalmanNet

多普勒激光雷达获取的是“径向速度”(即障碍物速度在激光扫描方向的分量),无法直接用于障碍物运动预测。D-KalmanNet的核心任务,就是通过几何矫正,从径向速度中恢复障碍物的真实线性速度,再结合卡尔曼滤波与RNN网络,精准预测障碍物未来位置,为后续规划提供依据。

多普勒速度矫正过程:通过几何计算,将雷达获取的径向速度,转化为障碍物可直接用于预测的真实线性速度。

随后,DPNet将矫正后的线性速度融入到了D-KalmanNet,一个基于卡尔曼滤波器的RNN网络。D-KalmanNet可以学习障碍物的线性速度与位置信息,并以此对其未来位置进行预测,从而指导下游运动规划。

D-KalmanNet模块示意,用于学习及预测障碍物未来位置。

2.2.核心模块2:DT-MPC

传统MPC(模型预测控制)控制器的参数调整,往往需要等待“碰撞、靠近”等失败案例才能触发,效率极低。而DT-MPC的创新是:结合D-KalmanNet预测的障碍物轨迹,提前预判“未来可能发生的碰撞”,无需实际失败案例,就能实时调整MPC参数,大幅提升规划效率和安全性。

DT-MPC模块示意,用于基于多普勒推测碰撞进行在线控制器调参。

DT-MPC的关键在于多普勒推测碰撞(Doppler-inferred collision)。在DT-MPC中,未执行的MPC horizon(规划时域)被视作对ego motion(自身运动)的预测。结合前述D-KalmanNet中对障碍物的预测,多普勒推测碰撞的检测通过如下两个步骤开展:

  1. 对于任何一个障碍物在horizon中的任何一步,检查其与对应步中ego的距离。如果小于某个距离阈值,则认定为多普勒推测碰撞。

  2. 根据不同障碍物存在的多普勒碰撞的先后顺序,进行MPC安全距离参数的tuning(参数调优)。

由此,得益于Doppler LiDAR提供的精准实时速度感知,DT-MPC可以实现不依赖于实际失败案例的在线控制器调参,避免了数据收集带来的低效率。

3.实验部分:高动态环境下,预测和导航双双碾压!

3.1.仿真实验:CARLA导航测试

实验第一部分在DynaBARN测试集上开展CARLA导航仿真测试,该测试集提供完全随机的高动态障碍物环境。测试结果显示,DPNet的无碰撞通过率远超OBCA、RDA、MPC-D-CBF等主流方法,尤其是障碍物数量较多时,优势更为明显; 消融实验(DPNet(ablation))进一步证明,DT-MPC模块是提升无碰撞通过率的关键。

导航定量结果:横坐标为障碍物数量,纵坐标为无碰撞通过率,可见随着障碍物增多,DPNet的通过率始终保持高位,显著优于其他基准方法。
导航定性展示(详见视频链接):直观呈现DPNet在高动态障碍物环境中的避障效果,响应迅速、轨迹平滑。

3.2. 真实数据集实验:障碍物位置预测测试

实验第二部分在AevaScenes多普勒雷达数据集上开展D-KalmanNet障碍物位置预测测试,该数据集涵盖城市与高速双场景,能有效验证模型的泛化性。测试结果显示,在对比KalmanFilter、Doppler-KalmanFilter和KalmanNet三种方法时,D-KalmanNet展现出超高的预测精度,尤其在高速移动障碍物场景中表现突出。

D-KalmanNet预测定量结果:在城市、高速双场景下,D-KalmanNet的预测精度均显著高于其他对比方法。
对于25m/s速度车辆位置预测的聚焦展示:D-KalmanNet能精准跟踪高速移动车辆的轨迹,预测误差远低于对比方法。

3.3.硬件效率测试

作者团队在NVIDIA Jetson Orin NX(嵌入式平台)上对D-KalmanNet进行了硬件效率测试,结果显示模型能实现高频运行,充分证明其轻量化特性,可满足实际机器人系统的部署需求,为后续落地应用奠定基础。

在NVIDIA Jetson Orin NX(嵌入式平台)上,D-KalmanNet实现高频运行,证明其轻量化特性,可满足实际机器人部署需求。

4.总结

DPNet的核心突破,在于首次将多普勒激光雷达(Doppler LiDAR)的速度感知优势与运动规划深度融合,打破了传统规划方法“依赖间接速度估计”的瓶颈,为高动态场景(自动驾驶、无人机、服务机器人等)的运动规划提供了全新范式。其轻量化、高频、高精度的特点确保机器人系统能像人类一样“快速反应、精准避障”。

结合DPNet的突破,未来可探索的方向十分广阔:(1).将多普勒激光雷达与更多机器人系统结合(如无人机、仓储机器人),解决各类高动态场景的避障难题;(2).进一步优化模型,提升极端环境(如雨天、雾天)下的速度感知精度等等。

本文仅做学术分享,如有侵权,请联系删文。

3D视觉方向论文辅导来啦!可辅导SCI期刊、CCF会议、本硕博毕设、核心期刊等。

添加微信:cv3d001,备注:姓名+方向+单位,邀请入群。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 9:50:33

基于Phi-4-mini-reasoning的智能问答系统搭建:从模型部署到Web界面

基于Phi-4-mini-reasoning的智能问答系统搭建:从模型部署到Web界面 1. 项目背景与核心价值 智能问答系统已经成为企业客服、知识管理、教育培训等领域的标配工具。传统方案要么依赖规则引擎(灵活性差),要么使用商业API&#xff…

作者头像 李华
网站建设 2026/4/16 9:48:12

PHP怎么合并数组_array_merge函数指南【指南】

array_merge要求所有参数为数组,传入非数组值会触发警告并返回null;数字键重排、字符串键覆盖;array_merge_recursive对同名键值自动聚合成数组;性能上为O(n2)拷贝操作。array_merge 合并空数组或非数组值会报错吗不会直接报错&am…

作者头像 李华
网站建设 2026/4/16 9:44:57

终极指南:mplfinance架构解析与金融数据可视化开发实践

终极指南:mplfinance架构解析与金融数据可视化开发实践 【免费下载链接】mplfinance Financial Markets Data Visualization using Matplotlib 项目地址: https://gitcode.com/gh_mirrors/mp/mplfinance mplfinance是基于Matplotlib的金融市场数据可视化库&a…

作者头像 李华
网站建设 2026/4/16 9:44:29

深入浅出DRM:图解STM32MP157的LTDC显示框架与Linux驱动核心结构

深入浅出DRM:图解STM32MP157的LTDC显示框架与Linux驱动核心结构 在嵌入式系统开发中,显示子系统往往是连接硬件与用户界面的关键桥梁。STM32MP157作为STMicroelectronics推出的高性能MPU系列,其集成的LTDC(LCD-TFT Display Contro…

作者头像 李华