一、引言
1.1 研究背景与核心痛点
在自动驾驶等领域,3D 场景感知的性能直接决定了系统的可靠性。当前,基于大规模数据集的 3D 感知模型在晴朗天气下已取得了令人满意的效果,但在雨、雪、雾等恶劣天气条件下,性能往往会急剧下降。这一问题的核心原因在于:恶劣天气会导致激光散射、衍射,引发 LiDAR 点云的噪声增加和点丢失,严重破坏数据的完整性与准确性。
然而,获取恶劣天气下的真实 LiDAR 数据面临着巨大挑战:
- 成本高昂:数据采集需要耗费大量的时间、人力和物力,尤其在极端天气条件下,采集难度和成本呈指数级增长;
- 数据稀缺:现有公开数据集(如 Seeing Through Fog)中,恶劣天气数据规模极小(每种天气仅 200-3000 帧),无法满足生成模型的训练需求;
- 传统方法局限:现有 LiDAR 模拟器多采用单一物理模型针对单一天气场景设计,且不具备学习能力。由于光学传播过程的复杂性和传感器参数的不完全可知性,这些方法生成的数据与真实数据存在显著的领域偏移(domain shift),保真度极低。
1.2 研究目标
本文提出了一个核心问题:能否构建一个统一、高保真、多样化的恶劣天气 LiDAR 数据生成框架?为实现这一目标,需要解决三个关键挑战:
- 高质量数据生成器:如何获取满足生成模型训练需求的、多样化且贴近真实分布的恶劣天气 LiDAR 数据?
- 高保真生成网络:如何设计适配 LiDAR 数据特性的生成模型,在处理噪声和点丢失的同时,保持数据的物理结构?
- 高区分度控制器:如何让生成模型能够精准响应不同天气的控制信号,避免在统一框架中出现天气类型混淆?
1.3 核心贡献
针对上述挑战,本文提出了 WeatherGen 框架,其核心贡献如下:
- 提出了首个统一的多样化天气 LiDAR 数据生成框架,通过地图映射式的数据生成器(MDP)为训练提供高质量数据;
- 设计了 Spider Mamba 生成器(SMG),通过沿 LiDAR 光束圈和中心射线建模,有效保持数据的物理结构,并结合潜在特征对齐器(LFA)融入真实世界知识;
- 提出了基于对比学习的控制器(CLC),通过语言监督让控制信号学习到紧凑且具有区分度的语义知识,实现精准的天气条件控制;
- 构建了 mini-weather 数据集,实验验证了生成数据在 3D 目标检测任务中的有效性,显著提升了恶劣天气下的下游任务性能。
原文链接:https://arxiv.org/pdf/2504.13561
代码链接:https://github.com/wuyang98/weathergen
沐小含持续分享前沿算法论文,欢迎关注...
二、相关工作
2.1 LiDAR 数据模拟
早期方法(如 DROR)通过 3D 异常值检测算法对恶劣天气下的 LiDAR 数据进行去噪,但未涉及数据生成。近年来,基于物理模型的模拟方法逐渐涌现:
- FSRL:基于光学原理模拟雾天数据;
- LSS:考虑地面湿润影响,模拟雪天数据;
- LISA:为雨、雪、雾设计不同参数的模拟模型。
这些方法的共同局限是:仅能针对单一天气设计专用模型,且生成数据的保真度受限于物理模型的准确性,无法匹配真实数据分布。
2.2 LiDAR 数据生成
现有 LiDAR 数据生成方法多基于 GAN 或扩散模型(DDPM):
- LiDARGen:首次验证了扩散模型在 LiDAR 数据生成中的可行性;
- LiDM、R2DM、Text2LiDAR:基于 DDPM 设计了更成熟的生成框架,但均未针对多样化天气场景优化;
- 共性问题:现有方法多将 LiDAR 数据投影为范围图(range map)后,采用卷积或自注意力机制处理,破坏了 LiDAR 数据的环形物理结构。
2.3 状态空间模型(SSM)
SSM 通过潜在状态连接输入输出序列,在序列建模中表现出色。Mamba 作为 SSM 的优化版本,引入了选择机制,能够选择性地传播或遗忘信息,在自然语言处理和计算机视觉领域均取得了突破。与 Transformer 相比,Mamba 具有更好的鲁棒性和泛化能力,且计算复杂度与序列长度呈线性关系,适合处理 LiDAR 这类大规模点云数据。本文首次将 Mamba 适配到 LiDAR 数据生成任务中,设计了 Spider Mamba 结构。
三、方法详解
WeatherGen 的整体框架如图 2 所示,核心由三部分组成:地图映射式数据生成器(MDP)、Spider Mamba 生成器(SMG)+ 潜在特征对齐器(LFA)、基于对比学习的控制器(CLC)。框架采用 “预训练 + 微调” 的训练策略,最终通过扩散模型的去噪过程生成高保真多样化天气 LiDAR 数据。
注:MDP 生成训练数据;SMG 遵循 LiDAR 成像过程建模去噪特征,LFA 将真实世界知识融入生成器;CLC 通过对比学习生成具有区分度的控制信号。
3.1 基础理论:DDPM 与 SSM
3.1.1 去噪扩散概率模型(DDPM)
DDPM 的核心是通过 “加噪 - 去噪” 过程学习数据分布,分为三个阶段:
扩散过程(加噪):从真实数据
出发,逐步加入高斯噪声,最终得到纯噪声数据
。单步加噪公式为:
,其中
(
为噪声权重),通过迭代推导可得到任意时刻t的数据分布:
,其中
,
。
推理过程(去噪):从纯噪声
出发,逐步恢复真实数据。后验分布为:
其中
,
,
是由 SMG 预测的噪声。
训练过程:目标是让模型学习预测加噪过程中的噪声
,采用均方误差(MSE)损失函数。
3.1.2 状态空间模型(SSM)
SSM 通过潜在状态建模序列动态,连续形式的动力学方程为:
其中A为状态演化矩阵,B和C为投影矩阵。通过零阶保持离散化后得到:
其中,
(
为步长参数)。最终输出通过全局卷积得到:
(
为结构化卷积核)。
3.2 地图映射式数据生成器(MDP)
MDP 的目标是生成多样化、贴近真实分布的恶劣天气 LiDAR 数据,用于模型预训练。与传统非学习型模拟器不同,MDP 引入了可学习掩码,能够自适应对齐真实数据分布。
3.2.1 核心设计
数据格式转换:首先将晴朗天气下的真实 LiDAR 点云
(包含坐标
和强度
)转换为范围图
,范围图的行列分别对应 LiDAR 的光束圈和中心射线,保留了数据的物理结构。
地图映射生成:通过地图到地图(map-to-map)的方式,生成不同天气的范围图
,公式如下:
其中各参数含义:
:天气类型;
:固定掩码(0/1),模拟激光的距离衰减(
时置 0,否则置 1,d为点云距离);
:可学习掩码,通过训练自适应调整,使生成数据对齐真实分布;
:与天气严重程度
相关的随机噪声(
越小,天气越恶劣);
- BDF:伯努利分布函数,模拟点云的随机丢失,丢失率与
相关。
3.2.2 优势
MDP 通过 “固定掩码 + 可学习掩码” 的组合,既保证了生成数据具有对应天气的基本特性(如雾天远距离点丢失、雪天随机噪声),又能通过学习自适应匹配真实数据分布,解决了传统模拟器保真度低的问题。
3.3 Spider Mamba 生成器(SMG)与潜在特征对齐器(LFA)
SMG 是 WeatherGen 的核心生成网络,专为 LiDAR 数据的物理结构设计,配合 LFA 融入真实世界知识,提升生成数据的保真度。
3.3.1 Spider Mamba 核心设计
现有方法(卷积、自注意力)在处理 LiDAR 范围图时存在明显缺陷:卷积仅能局部建模,自注意力则无序连接所有点,破坏了 LiDAR 的环形物理结构(如图 3 所示)。
注:(a) Spider Mamba 沿光束圈和中心射线建模,保持物理结构;(b) 卷积局部建模;(c) 自注意力无序连接,破坏物理特性。
为解决这一问题,SMG 采用以下设计:
- 建模方式:沿 LiDAR 的光束圈(范围图行)和中心射线(范围图列)进行序列建模,完全匹配 LiDAR 的成像过程;
- 网络结构:采用 U 形去噪结构,编码器和解码器均由卷积块和 Spider Mamba 块组成;
- 高效计算:参考 UltraLight VM-UNet,将特征按通道分解为 4 个分支,分别进行 Mamba 建模,降低计算复杂度。
3.3.2 SMG 训练过程
- 输入加噪后的范围图
,通过卷积映射为潜在特征
(
为像素数,
为通道数);
- 将
按通道分解为 4 个分支
,每个分支通过线性投影转换为嵌入
;
- 将
输入 Mamba 层,经过
层迭代得到输出
,归一化后通过 MLP 头得到预测特征
;
- 拼接 4 个分支的
得到最终潜在特征
,通过解码器输出预测噪声
;
- 采用 MSE 损失监督噪声预测:
其中为 SMG 的可学习参数,
为时间步嵌入,
为 CLC 输出的控制信号。
3.3.3 潜在特征对齐器(LFA)
为进一步提升生成数据的真实性,LFA 将真实世界数据的分布知识融入 SMG,具体流程:
- 利用 SMG 预测的噪声
进行一步生成,得到
;
- 将生成数据
与真实恶劣天气数据
通过线性投影映射到统一潜在空间
;
- 从两者的潜在分布中采样
和
,采用 KL 散度对齐两个分布:
其中(
为随机噪声)。
LFA 通过直接对齐生成数据与真实数据的分布,让模型学习到真实天气的特征模式,进一步缩小了生成数据与真实数据的差距。
3.4 基于对比学习的控制器(CLC)
CLC 的目标是生成具有高区分度的天气控制信号,避免在统一框架中出现天气类型混淆,核心是通过对比学习和语言监督,让控制信号学习到紧凑的语义知识。
3.4.1 核心结构
CLC 由两部分组成:
- 天气编码器:输入原始天气数据
,输出天气嵌入
;
- 冻结的 CLIP 文本编码器:输入预设的天气文本提示(“snow”“rain”“fog”“clear”),输出语义嵌入
。
3.4.2 对比学习损失
CLC 的损失函数基于信息瓶颈(IB)理论,通过对比学习优化天气嵌入与语义嵌入
的互信息:
其中:
为互信息;
(经验设置);
为 CLC 的可学习参数;
- 优化目标:最小化
与非对应天气语义嵌入
的互信息(减少冗余),最大化
与对应天气语义嵌入
的互信息(增强区分度)。
3.4.3 控制信号融合
最终的天气控制信号w与时间步嵌入t拼接后,沿通道维度与 SMG 的特征融合,指导模型生成对应天气的 LiDAR 数据。
3.5 整体损失函数与训练策略
3.5.1 整体损失
预训练阶段的整体损失函数为三部分损失之和:
3.5.2 训练流程
- 预训练:使用 MDP 生成的多样化天气数据训练模型,优化所有参数;
- 微调:使用真实世界的恶劣天气数据(Seeing Through Fog 数据集)微调模型,固定 MDP 的参数,更新 SMG、LFA 和 CLC 的参数;
- 推理:微调完成后,仅使用 CLC 和 SMG 进行推理,通过 DDPM 的去噪过程生成目标天气的 LiDAR 数据。
四、实验验证
4.1 实验设置
4.1.1 数据集
- KITTI-360:以晴朗天气为主,包含 50,348 帧训练 / 验证数据和 26,367 帧测试数据,用于无条件生成实验;
- Seeing Through Fog:包含雪、雨、雾三种恶劣天气数据(每种天气 200-3000 帧),用于有条件生成、消融实验和下游任务验证。
4.1.2 评价指标
- 分布相似度指标:用于衡量生成数据与真实数据的分布差异:
- FPD(Frechet Point Cloud Distance):点云形式的 Frechet 距离;
- FRD(Frechet Range map Distance):范围图形式的 Frechet 距离;
- MMD(Minimum Matching Distance):BEV 占用网格的最小匹配距离;
- JSD(Jensen-Shannon Divergence):BEV 占用网格的 JS 散度;注:所有指标均为 “越小越好”。
- 下游任务指标:3D 目标检测的 AP(Average Precision),包括 Car AP@0.5IoU、Cyclist AP@0.25IoU、Pedestrian AP@0.25IoU,以及不同距离区间(0-30m、30-50m、50-80m)的 AP(“越大越好”)。
4.1.3 对比方法
- 无条件生成:LiDAR-GAN、LiDAR-VAE、ProjectedGAN、LiDARGen、LiDM、R2DM、Text2LiDAR;
- 有条件生成(天气模拟):LSS(雪)、FSRL(雾)、LISA(雨 / 雪 / 雾);
- 下游任务对比:DROR、FSRL、LSS、LISA(均为基于模拟数据的增强方法)。
4.2 无条件生成实验
无条件生成实验旨在验证 WeatherGen 在晴朗天气下的生成质量,结果如表 1 所示。
从表 1 可以看出:
- WeatherGen 在 FRD、BEV MMD 和 BEV JSD 指标上均取得最优成绩,FPD 指标仅次于 Text2LiDAR;
- 与 Text2LiDAR 相比,WeatherGen 的参数更少(31.7M vs 45.8M),生成速度更快(7.83s vs 12.57s),实现了性能、参数和速度的平衡。
视觉对比结果如图 4 所示,WeatherGen 生成的点云具有更清晰的物体轮廓和更完整的结构,而 R2DM 和 Text2LiDAR 生成的点云噪声较多,且存在点云穿透物体的问题。
注:WeatherGen 生成的点云更符合 LiDAR 物理特性,物体轮廓清晰。
4.3 有条件生成实验
有条件生成实验验证 WeatherGen 在雪、雨、雾三种恶劣天气下的生成质量,定量对比结果如表 2 所示。
从表 2 可以看出:
- 对于雪和雨天气,WeatherGen 的所有指标均显著优于传统模拟方法,FPD 指标分别降低了 43.3%(雪)和 71.3%(雨);
- 对于雾天气,WeatherGen 的 FRD、BEV MMD 和 BEV JSD 指标均优于 FSRL,仅 FPD 指标略高,整体表现更优。
视觉对比结果如图 5 所示,WeatherGen 生成的数据在成像特征和天气特性上与真实数据高度一致,而传统模拟方法生成的数据与真实数据存在明显差异。
注:WeatherGen 生成的数据与真实数据在噪声分布、点丢失模式上高度匹配。
4.4 消融实验
消融实验在 Seeing Through Fog 的 “大雪” 测试集上进行,验证各核心模块的有效性,结果如表 3 所示。
消融实验结论:
- MDP 的有效性:移除 MDP(-MDP)后,FPD 和 BEV JSD 指标下降,说明可学习的数据生成器能提供更高质量的训练数据;
- SMG 的有效性:用 U-Net 替代 SMG(-SMG)后,所有指标均下降,说明 Spider Mamba 的建模方式更适配 LiDAR 数据的物理结构;
- CLC 的有效性:移除 CLC(-CLC)后,控制信号质量下降,导致生成数据与目标天气不匹配,指标恶化;
- LFA 的有效性:加入 LFA(+LFA)后,FRD 和 BEV MMD 指标提升,说明真实数据分布对齐能增强生成数据的保真度;
- 微调的有效性:经过微调(+ 微调)后,所有指标均显著提升,验证了 “预训练 + 微调” 策略的合理性。
此外,t-SNE 可视化结果(图 6)显示,WeatherGen 生成的数据分布与真实数据高度重叠,而传统模拟数据(无 MDP 和微调)与真实数据存在明显偏移。
注:WeatherGen 生成的数据(红色)与真实数据(蓝色)分布更接近,模拟数据(绿色)偏移明显。
4.5 下游任务:3D 目标检测
为验证生成数据的实际价值,本文构建了 mini-weather 数据集(每种天气 256 帧,使用 LabelCloud 标注),将其用于 3D 目标检测模型的训练增强,对比结果如表 4-6 所示(采用 PointPillars 作为检测器)。
表 4 浓雾场景 3D 目标检测结果
表 5 大雪场景 3D 目标检测结果
表 6 雨天场景 3D 目标检测结果
下游任务实验结论:
- WeatherGen 生成的数据在 21 个评价指标中,18 个指标取得最优成绩,显著优于传统模拟数据增强方法;
- 仅使用 7.4% 的生成数据(替换训练集中 256 帧晴朗数据),就能大幅提升恶劣天气下的检测性能,其中浓雾场景的 Pedestrian AP 提升 5.73%,雨天场景的 50-80m Car AP 提升 5.56%;
- 生成数据的标注成本远低于真实数据采集(几天 vs 几年),具有极高的实际应用价值。
4.6 复杂度分析
模型复杂度对比结果如图 8 所示,WeatherGen 在参数数量、生成速度和性能之间实现了最优平衡:
- 与 R2DM 相比,WeatherGen 仅增加 0.6M 参数,FRD 指标提升 7.38%;
- 与 LiDARGen 相比,WeatherGen 的 FRD 指标提升 76.07%,生成速度提升 91.16%;
- 与 Transformer-based 的 Text2LiDAR 相比,WeatherGen 参数更少(31.7M vs 45.8M),生成速度更快(7.83s vs 12.57s),且 BEV 指标更优。
注:WeatherGen 在性能、参数、速度三者间达到最佳平衡。
五、结论与展望
5.1 主要结论
本文提出了 WeatherGen,首个统一的多样化天气 LiDAR 数据生成框架,通过以下创新点解决了现有方法的局限:
- 地图映射式数据生成器(MDP):提供高质量、多样化的训练数据,自适应对齐真实分布;
- Spider Mamba 生成器(SMG):沿 LiDAR 物理结构建模,保持数据的空间特性;
- 潜在特征对齐器(LFA):融入真实世界知识,提升生成数据保真度;
- 基于对比学习的控制器(CLC):实现精准的天气条件控制,避免类型混淆。
实验验证表明,WeatherGen 生成的数据在分布相似度和下游任务性能上均显著优于现有方法,构建的 mini-weather 数据集为恶劣天气下的 3D 感知研究提供了重要支持。
5.2 未来展望
- 扩展更多天气类型(如沙尘、冰雹),进一步提升框架的通用性;
- 优化模型的计算效率,实现实时生成,满足自动驾驶系统的在线数据增强需求;
- 结合多传感器数据(如相机图像、雷达数据),生成多模态的恶劣天气数据,推动多模态感知研究。