news 2026/7/4 5:08:43

【YOLOv8多模态融合改进】| TGRS 2025 HFFE分层特征融合编码器 双模态注意力加权 + 跨尺度对齐融合,强化弱小目标多模态特征互补

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【YOLOv8多模态融合改进】| TGRS 2025 HFFE分层特征融合编码器 双模态注意力加权 + 跨尺度对齐融合,强化弱小目标多模态特征互补

一、本文介绍

本文记录的是利用分层特征融合模块HFFE改进YOLOv8的可见光-红外双模态目标检测

HFFE(Hierarchical Feature Fusion Encoder)通过可见光-红外特征分辨率对齐、空间注意力模态筛选与坐标注意力位置编码结合自适应完成深浅层双模态特征加权交互,打通可见光纹理与红外热辐射信息融合通路。本文利用HFFE模块,先通过双线性插值统一不同层级可见光、红外特征空间尺度,再借助空间注意力分别滤除两类模态无关背景,生成跨模态空间权重矩阵动态分配模态特征贡献,依托坐标注意力留存多模态小目标空间位置信息,针对性增强红外弱小目标热特征与可见光轮廓纹理,同步抑制可见光杂波、红外热云无效背景干扰在编码器分层融合阶段实现双模态细节与全局热语义高效互补,解决传统单尺度拼接带来的模态语义错位问题,大幅提升复杂暗光、海面云层场景下多模态红外小目标检测精度。


专栏目录:《多模态模型改进》目录一览 | 专栏介绍 ,多模态的全方位改进,提供多模态模型改进完整项目包-开箱即用

专栏地址:YOLO系列模型的多模态融合改进——极易上手、非常好发文的多模态改进教程!

文章目录

  • 一、本文介绍
  • 二、HFFE介绍
    • 2.1 设计出发点
    • 2.2 模块结构
    • 2.3 模块优势
  • 三、HFFE实现代码
  • 四、添加步骤
    • 4.1 修改一
    • 4.2 修改二
    • 4.3 修改三
  • 五、yaml模型文件
    • 5.1 中期融合⭐
    • 5.2 中-后期融合⭐
    • 5.3 后期融合⭐
  • 六、成功运行结果

二、HFFE介绍

2.1 设计出发点

可见光模态富含纹理、边缘细节,但低照度、云雾场景目标对比度极低;红外模态突出热辐射弱小目标,但缺失场景纹理与空间轮廓。传统同尺度跳跃连接仅简单拼接两类模态单层特征,存在三大缺陷:

  1. 高低层级、双模态特征语义鸿沟大,直接融合会引入可见光杂波与红外背景噪声;
  2. 无法自适应区分可见光纹理特征、红外热目标特征的贡献度,弱小目标易被可见光细节淹没;
  3. 缺少跨层级、跨模态双向交互,不能同步聚合浅层多模态细节与深层全局热语义。
    因此设计HFFE,依托空间+坐标双注意力实现可见光-红外多模态分层自适应融合,对齐不同尺度双模态特征、区分模态专属有效信息,抑制两类模态冗余背景干扰。

2.2 模块结构

HFFE(Hierarchical Feature Fusion Encoder)分层特征融合编码器:

  1. 多模态分辨率对齐:输入可见光浅层细节特征、红外深层语义特征,对高层红外特征双线性上采样匹配浅层可见光尺寸,消除模态尺度差;
  2. 双注意力精炼:分别对可见光、红外特征执行空间注意力SAM过滤背景,再生成跨模态空间权重矩阵SWM双向加权;
  3. 坐标注意力跨模态关联:编码可见光轮廓、红外热目标横竖空间位置,保留多模态小目标定位信息;
  4. 分层融合输出
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/4 5:07:04

E-Hentai资源获取工具:革新性批量下载的效率革命

E-Hentai资源获取工具:革新性批量下载的效率革命 在数字内容爆炸的时代,E-Hentai漫画爱好者面临着一个普遍痛点:如何高效获取和管理喜爱的漫画资源。传统的手动下载方式不仅耗费大量时间,还容易出现遗漏和错误。本文将介绍一款革…

作者头像 李华
网站建设 2026/7/4 5:06:47

《大模型实战指南》—— 面向软件开发者的系统性入门8

第八章 未来演进:多模态、Agent、MoE 与推理优化新范式 “站在浪潮之巅,不是为了追逐风口,而是为了看清方向。” —— 本书作者 _abab 本文为原创技术书稿节选,AI 辅助梳理框架,全部技术内容经实操核验,仅用于技术学习交流。 8.1 多模态大模型:从 “会说话” 到 “看得…

作者头像 李华
网站建设 2026/7/4 5:02:54

Qwen-Image-Edit-Rapid-AIO:打破AI图像编辑门槛的4步革命

Qwen-Image-Edit-Rapid-AIO:打破AI图像编辑门槛的4步革命 【免费下载链接】Qwen-Image-Edit-Rapid-AIO 项目地址: https://ai.gitcode.com/hf_mirrors/Phr00t/Qwen-Image-Edit-Rapid-AIO 你是否曾经被复杂的AI图像编辑工具劝退?面对十几个节点、…

作者头像 李华
网站建设 2026/7/4 5:02:19

直流电机双闭环控制原理与Simulink仿真实践

1. 直流电机双闭环控制的核心价值在工业自动化领域,直流电机因其优异的调速性能和控制特性,至今仍在许多高精度场合占据重要地位。我十年前第一次接触轧钢机的电控系统时,就被其双闭环控制架构的精妙所震撼——外环转速控制确保生产节奏稳定&…

作者头像 李华
网站建设 2026/7/4 5:00:14

第170章 听证会的逆转(墨子)

在近期围绕弦光研究院召开的全球技术听证会上,争论的焦点集中于三项关键技术能力:其High‑NA EUV光刻系统通过多层反射镜面光学设计与双工作台精密对准,实现了3nm以下制程的量产,直接推动全球晶圆代工成本下降约40%;其…

作者头像 李华