news 2026/4/27 11:04:42

YOLO系列算法改进 | C2PSA改进篇 | 融合FDFAM频率域特征聚合模块 | 频域解耦与跨模态互补,破解夜间及多模态特征失衡难题 | TMM 2026

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLO系列算法改进 | C2PSA改进篇 | 融合FDFAM频率域特征聚合模块 | 频域解耦与跨模态互补,破解夜间及多模态特征失衡难题 | TMM 2026

0. 前言

本文介绍FDFAM(Frequency Domain Feature Aggregation Module)频率域特征聚合模块,并将其集成到ultralytics最新发布的YOLO26目标检测算法中,构建C2PSA_FDFAM创新模块。FDFAM是一种突破传统空间域注意力限制的频域特征融合机制,基于卷积定理将特征转换到频率域,通过逐元素乘积高效捕获可见光与红外模态间的互补信息。将FDFAM嵌入YOLOv26的C2PSA模块中,能够显著增强模型在弱光照、雨雾、夜间等复杂环境下的多模态感知能力,通过频域解耦有效解决跨模态特征语义冲突与信息失衡问题。这一创新尤其适用于全天候智慧安防、自动驾驶夜间感知、无人机多光谱巡检、边防监控等高价值场景,在保持低计算开销的同时,大幅提升对遮挡目标、恶劣环境干扰及多模态配准误差的检测鲁棒性。

专栏链接:YOLO系列算法改进专栏链接

专栏文章:YOLO26改进系列 | 卷积篇、轻量化、注意力、损失函数、Backbone、SPPF、C2PSA、Neck、检测头全方面保姆级优化合集 | 同样适配YOLOv11改进!!!

目录

0. 前言

1. FDFAM模块简介

2. FDFAM模块原理与创新点

🧠 FDFAM模块基本原理

🎯 FDFAM模块创新点

3. 具体改进步骤

🍀🍀步骤1:创建C2PSA_FDFAM.py文件

🍀🍀步骤2:tasks.py文件修改

🍀🍀步骤3:创建YAML配置文件

🍀🍀步骤4:新建train.py文件训练模型

🍀🍀步骤5:模型结构打印结果


1. FDFAM模块简介

与现有大多使用空间域Transformer提取RGB-IR图像对互补特征的多模态检测方法不同,我们设计了一个频率域特征聚合模块(FDFAM),以更好地挖掘和融合跨模态互补特征。FDFAM由多模态频率域注意力(MFDA)、两个频率域前馈层(FDFFL)、一个拼接操作和一个带激活函数的卷积层组成。受卷积定理启发——空间域中两个信号的相关性等价于它们在频率域中的逐元素乘积,我们提出了一种有效的MFDA来捕获跨模态信息之间的像素级相关性。首先,对每个模态通过层归一化、标准1×1卷积和3×3深度卷积生成查询Q、键K和值V。随后,引入快速傅里叶变换(FFT)对RGB和红外特征的Q和K进行域变换,并利用逐元素乘法计算不同模态下Q和K之间的相似度。之后,应用逆快速傅里叶变换(IFFT)和层归一化将频率信息恢复并归一化。为捕获跨模态相关性,通过逐元素乘法将一个模态的V与另一模态的归一化结果进行交互。最后,通过1×1卷积和加法操作得到MFDA的输出结果。此外,基于混合尺度频率特征融合策略,我们设计了FDFFL。通过层归一化后,将归一化特征送入三个分支,分别使用不同卷积核的标准卷积和深度卷积捕获多尺度表示,并经过ReLU激活。然后将空间特征信息通过FFT转换为频率信息,在通道维度上将每个频率信息分割成三个块,以相互混合的方式进行拼接,最后通过IFFT恢复并通过1×1卷积降维,与初始信息相加得到最终结果。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/27 11:03:47

大模型---OpenClaw

目录 1.OpenClaw的定义 2.OpenClaw的基本架构 3.tools,skills,plugins 4.OpenClaw的缺陷 (1)长上下文管理 (2)安全边界 5.OpenClaw与Claude Code的区别 想快速了解OpenClaw,可以先看看这个视频: 一个视频搞懂OpenClaw!_哔哩哔哩_bilibili 接下来详细讲一下Ope…

作者头像 李华
网站建设 2026/4/27 11:00:22

终极游戏资源编辑器:ExtractorSharp完整指南与实战教程

终极游戏资源编辑器:ExtractorSharp完整指南与实战教程 【免费下载链接】ExtractorSharp Game Resources Editor 项目地址: https://gitcode.com/gh_mirrors/ex/ExtractorSharp ExtractorSharp是一款功能强大的开源游戏资源编辑器,专门用于编辑和…

作者头像 李华
网站建设 2026/4/27 10:59:34

AutoCAD二次开发(插件)对许可证管理的影响

不少时候,企业客户来找我,并不是要用AutoCAD二次开发,竟而是因为公司的许可管控太难了。那帮人想要的其实老简单:咋样让那伙没用的许可“动起来”,反倒并非躺在服务器上白花钱。我说今天啊就聊聊AutoCAD二次开发对此痛…

作者头像 李华
网站建设 2026/4/27 10:59:26

JX3Toy:剑网3自动化DPS测试的终极解决方案

JX3Toy:剑网3自动化DPS测试的终极解决方案 【免费下载链接】JX3Toy 一个自动化测试DPS的小工具 项目地址: https://gitcode.com/GitHub_Trending/jx/JX3Toy JX3Toy是一款专为剑网3玩家设计的开源自动化工具,通过Lua脚本实现技能自动释放和DPS测试…

作者头像 李华
网站建设 2026/4/27 10:54:56

打造高效B站视频管理方案:DownKyi批量下载与音视频处理实战指南

打造高效B站视频管理方案:DownKyi批量下载与音视频处理实战指南 【免费下载链接】downkyi 哔哩下载姬downkyi,哔哩哔哩网站视频下载工具,支持批量下载,支持8K、HDR、杜比视界,提供工具箱(音视频提取、去水印…

作者头像 李华