news 2026/3/2 12:17:55

【北理工-AAAI26】Earth-Adapter:专治卫星图像分割的“干扰顽疾”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【北理工-AAAI26】Earth-Adapter:专治卫星图像分割的“干扰顽疾”

文章:Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation

代码:https://github.com/VisionXLab/Earth-Adapter

单位:北京理工大学


一、问题背景:视觉AI在遥感领域的“水土不服”

近年来,CLIP、DINOv2等视觉基础模型(VFMs)凭借海量数据预训练,在普通图像任务中表现惊艳。为了让这些大模型快速适配下游任务,参数高效微调(PEFT)方法(如LoRA、VPT)成为主流,既能保留模型原有能力,又能减少计算成本。

但当这些方法应用到遥感图像分割时,却出现了严重的“性能滑坡”:

  • 遥感图像没有明确主体,农田、建筑、道路等多尺度目标混杂,且采用俯视视角,导致“干扰信息”(学术上称为“伪影”)遍布全图;

  • 普通图像的干扰仅围绕前景物体(如人、动物),影响有限,而遥感图像的干扰会严重破坏像素级特征提取,让分割结果漏洞百出;

  • 现有PEFT方法专为自然语言或普通图像设计,无法应对遥感图像的特殊干扰,甚至会越调越差。

二、方法创新:“分而治之”的Earth-Adapter

针对上述痛点,研究团队推出了首个专为遥感图像设计的PEFT方法——Earth-Adapter,核心思路是“拆分干扰、精准治理”,具体分为三步:

1. 频率拆分:用傅里叶变换隔离干扰

通过离散傅里叶变换(DFT),将模型提取的图像特征拆分为两部分:

  • 低频特征:对应图像全局结构(如大片农田、整块建筑区),干扰少、语义清晰;

  • 高频特征:对应局部细节(如道路边缘、小地块边界),也是干扰信息的主要聚集地。 这一步相当于把“有用信息”和“干扰噪音”分离开来,为后续治理打基础。

2. 多适配器优化:针对性“修复”特征

设计了三个专门的“适配器”(可理解为三个精准工具),分别处理不同类型的特征:

  • 空间适配器:优化图像空间布局,让区域划分更精准;

  • 低频适配器:强化全局语义,确保大场景判断不跑偏;

  • 高频适配器:专门清理高频特征中的干扰,同时保留有用细节。

3. 动态融合:智能加权出最优结果

加入一个“动态路由器”,像智能裁判一样,根据图像实际情况给三个适配器的结果分配不同权重,再通过残差连接与原始模型特征融合。既保留了视觉基础模型的强大能力,又通过“去干扰”优化了特征质量。

整个流程参数高效(仅2.6M-9.6M可训练参数),且不改变原始模型结构,适配性极强。

三、实验结果:三大任务全面领先

研究团队在12个主流遥感图像分割基准数据集上,对Earth-Adapter进行了全面测试,涵盖普通语义分割(SS)、跨域自适应(DA)、跨域泛化(DG)三大核心任务,结果亮眼:

1. 普通语义分割(SS)

在Potsdam、Vaihingen等4个数据集上,平均mIoU(分割准确率指标)达到68.8%,比基线模型Rein提升1.2%,在所有PEFT方法中排名第一。

2. 跨域自适应(DA)

面对不同场景(如城市到乡村、A数据集到B数据集)的适配挑战,Earth-Adapter平均mIoU达59.0%,较基线提升9.0%,其中在“城市到乡村(U2R)”任务中,性能提升高达24.0%,彻底解决了跨场景适配难题。

3. 跨域泛化(DG)

在无目标域标签的情况下,模型平均mIoU达56.2%,比基线提升3.1%,展现出极强的通用性,无需重新训练就能适配新场景。

此外,Earth-Adapter在参数规模更小的情况下,训练和推理速度与基线模型基本持平,实现了“性能、效率、通用性”三者兼顾。

四、优势与局限

核心优势

  1. 针对性强:首个专门解决遥感图像干扰问题的PEFT方法,直击行业痛点;

  2. 高效灵活:仅需少量可训练参数,适配不同规模的视觉基础模型(DINOv2-S/B/L等),且不依赖遥感预训练数据;

  3. 场景覆盖广:在普通分割、跨域适配、跨域泛化三大任务中均达SOTA水平,应用场景更全面;

  4. 易落地:训练推理速度快,无需大规模算力支持,便于实际业务部署。

现存局限

  1. 对参数配置敏感:部分任务中,适配器维度、频率 cutoff 值等参数需要精细调整才能达到最优性能;

  2. 高频特征处理仍有优化空间:单独使用高频适配器时性能下降明显,对高频干扰的治理能力可进一步提升;

  3. 多模态适配不足:目前仅针对光学遥感图像优化,尚未拓展到SAR、红外等多模态遥感数据。

五、一句话总结

Earth-Adapter通过“频率拆分+多适配器优化+动态融合”的创新思路,攻克了视觉基础模型在遥感图像分割中的干扰难题,以高效、通用的优势成为该领域的SOTA方案,为遥感AI的工程化落地提供了新路径。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/27 23:02:44

51、构建安全的 Syslog-ng 服务器:SSL 密钥创建与配置指南

构建安全的 Syslog-ng 服务器:SSL 密钥创建与配置指南 在网络管理中,确保日志服务器的安全性至关重要。本文将详细介绍在 Debian 和 Fedora 系统上为 Syslog-ng 服务器创建 SSL 密钥,以及配置 stunnel 和 Syslog-ng 的具体步骤。 1. 邮件服务器消息测试与访问控制 在进行…

作者头像 李华
网站建设 2026/2/28 16:07:52

4、F-RAN技术:应用案例与发展趋势

F-RAN技术:应用案例与发展趋势 1. F-RAN概述 F-RAN(Fog Radio Access Network)作为5G的先进技术解决方案,与仅使用C-RAN模式相比,通过自适应模型选择,F-RAN可以带来更高的频谱效率(SE)和更低的延迟,同时还能够提高能源效率(EE)。在实际的F-RAN中,关联模式是关键,…

作者头像 李华
网站建设 2026/2/28 11:19:20

ADC策略引擎集成LLama-Factory输出结果实现智能决策转发

ADC策略引擎集成LLama-Factory输出结果实现智能决策转发 在当今企业级服务架构中,用户请求的语义复杂性正以前所未有的速度增长。一个简单的“我打不开账户”可能指向登录失败、密码错误、风控锁定甚至页面加载异常等多个问题。传统基于关键词和静态规则的路由系统面…

作者头像 李华
网站建设 2026/3/1 10:24:36

ComfyUI+ControlNet:精准控制AI绘画动作与结构

ComfyUI ControlNet:让AI绘画真正“听懂”你的结构指令 在动画工作室的某个深夜,一位原画师正为角色动作序列发愁——明明输入的是“抬手挥剑”,AI 却每次生成不同的姿势,导致帧与帧之间出现诡异的抖动。他试了十几遍提示词&…

作者头像 李华
网站建设 2026/2/28 3:02:05

8个降AI率工具推荐,本科生论文必备

8个降AI率工具推荐,本科生论文必备 当AI痕迹成为论文的“致命伤” 对于大多数本科生而言,写论文从来都不是一件轻松的事。从选题到查资料,从列大纲到撰写正文,每一个环节都充满了挑战。而如今,随着AI写作工具的普及&am…

作者头像 李华
网站建设 2026/2/28 2:12:53

10 个降AI率工具推荐,专科生必备!

10 个降AI率工具推荐,专科生必备! 当AI痕迹成为论文的“致命伤”对于专科生来说,写论文从来不是一件轻松的事。尤其是面对AI生成内容被系统检测出高AI率时,那种焦虑和无助感简直让人窒息。很多同学在提交论文前,满怀信…

作者头像 李华