news 2026/2/12 7:57:18

频域+Transformer!顶会优先推荐思路,发文效果显著!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
频域+Transformer!顶会优先推荐思路,发文效果显著!

频域+Transformer这个方向的核心吸引力在于,它给Transformer的黑箱机制提供了个全新的、可解释的理论视角,并带来了实质性的性能与效率提升。

因此它在当前是非常热门且适合发表高水平论文的方向,从顶会到顶刊都有不少成果。比如TMM 2025的Frefusion框架、IEEE TGRS的FGNet模型、ECCV 2024的FADformer框架...

从这些研究中可以看出,这方向接下来的创新将更侧重于理论深度、架构通用性、领域延展性以及软硬协同。如果想入手,建议基于现有成果找突破口。本文整理了11篇频域+Transformer前沿论文,附代码,需要参考的直接领取即可。

全部论文+开源代码需要的同学看文末

FreDFT: Frequency Domain Fusion Transformer for Visible-Infrared Object Detection

方法:论文提出频域融合 Transformer(FreDFT)用于可见光 - 红外目标检测,通过频域注意力和频域前馈层挖掘跨模态互补信息,结合局部特征增强与跨模态全局建模,解决模态不平衡问题,提升检测性能。

创新点:

  • 将频域与Transformer结合,提出FreDFT用于可见光-红外目标检测,挖掘跨模态互补信息。

  • 设计MFDA和FDFFL,分别捕捉模态相关性、融合多尺度频域特征。

  • 构建LFEM和CGMM,强化局部特征并缓解模态异质性,解决模态不平衡。

Frefusion: Frequency Domain Transformer for Infrared and Visible Image Fusion

方法:论文提出Frefusion框架用于红外与可见光图像融合,通过频域特征提取模块提取源图像频域特征,借助含域内/域间强化模型的频域Transformer融合模块融合特征,结合残差重建模块生成融合图像,利用频域特性提升融合质量与抗伪影能力。

创新点:

  • 提出频域特征提取模块,通过FFT和iFFT转换特征,提取图像深层语义与全局纹理信息。

  • 设计含域内/域间强化的频域Transformer融合模块,增强模态内有效信息与模态间互补信息。

  • 构建残差重建模块与多损失函数,联合优化红外与可见光图像融合质量。

Efficient Frequency-Domain Image Deraining with Contrastive Regularization

方法:论文提出 FADformer 用于单图像去雨,通过融合傅里叶卷积混合器在频域与空域高效建模全局 - 局部特征,结合先验门控前馈网络强化细节修复,并引入频域对比正则化利用正负样本信息,实现高效且高质量的去雨效果。

创新点:

  • 设计融合傅里叶卷积混合器,在频域与空域同步进行卷积操作,高效捕捉全局-局部特征,降低计算成本。

  • 提出先验门控前馈网络,以门控方式引入残差通道先验,强化局部细节修复与特征结构保留。

  • 引入频域对比正则化,利用DFT构建对比空间,充分挖掘正负样本的频域特征差异,提升去雨性能。

Frequency-domain guided swin transformer and global-local feature integration for remote sensing images semantic segmentation

方法:论文提出 FGNet 用于遥感影像语义分割,将频域引导机制融入 Swin Transformer 构建 FGSwin,结合残差 CNN 提取局部特征与全局 - 局部特征融合模块(GLFI),同步建模频域、空域及全局 - 局部特征,提升分割精度与类别区分度。

创新点:

  • 提出FGSwin,将频域引导机制融入Swin Transformer,结合FFT和可学习权重建模频域与空域信息。

  • 设计GLFI模块,通过小卷积核和SiLU激活函数,轻量化融合全局与局部特征。

  • 构建双分支架构,结合FGSwin与残差CNNs,提升遥感影像语义分割的精度与类别区分度。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“222”获取全部方案+开源代码

码字不易,欢迎大家点赞评论收藏

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/11 2:16:22

Linux命令-lha(压缩或解压缩lzh格式文件)

🧭说明 lha 是一个用于处理 .lzh 和 .lha 格式压缩文件的Linux命令行工具,它源自日本开发者Haruhiko Okumura的LHA压缩算法,主要用于兼容旧的压缩文件,尤其在处理早年日本系统留下的归档文件时比较有用。 📌 主要功能与…

作者头像 李华
网站建设 2026/2/8 23:04:36

【课程设计/毕业设计】基于 Android 的教室预约APP 的设计与实现基于Android的高校教室预约管理平台【附源码、数据库、万字文档】 4 :【计算机毕业设计案例】(程序+文档+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/10 6:46:53

大数据领域 OLAP 在农业领域的应用探索

大数据领域 OLAP 在农业领域的应用探索 关键词:大数据、OLAP、农业领域、数据分析、决策支持 摘要:本文聚焦于大数据领域中 OLAP(联机分析处理)技术在农业领域的应用。首先介绍了研究的背景、目的、预期读者和文档结构等内容&…

作者头像 李华
网站建设 2026/2/8 12:57:04

用知识图谱提升虚拟品牌的“认知能力”:AI架构师的实战经验

用知识图谱提升虚拟品牌的“认知能力”:AI架构师的实战经验 一、引言:虚拟品牌的“懂用户”难题 你有没有遇到过这样的虚拟品牌? 你问:“敏感肌能用你们的精华吗?”它回答:“我们的精华含有玻尿酸。”你…

作者头像 李华
网站建设 2026/2/11 19:41:34

吐血推荐!继续教育10款AI论文软件深度测评

吐血推荐!继续教育10款AI论文软件深度测评 2026年继续教育AI论文工具测评:为何需要这份榜单? 在继续教育领域,论文写作已成为许多学员提升学历、拓展职业发展的关键环节。然而,面对繁重的工作任务与有限的写作时间&a…

作者头像 李华
网站建设 2026/2/11 3:31:18

初始C++: C++入门以及 类和对象初识

编译环境为VS2022 文章目录 前言一.初识C1.第一个C程序的编写2.命名空间的了解3.C的输入输出4.C的引用一.引用是什么?二.引用的特性 和 const引用的了解三.指针和引用的关系 二.类和对象初识1.类的定义2.类的访问限定符3.this指针4.类的默认成员函数一.构造函数二.析…

作者头像 李华