news 2026/6/21 21:32:14

RT-DETR改进策略【Conv和Transformer】| ICLR 2025 PolaLinearAttention 极性感知线性注意力 全符号交互 + 可学习降熵,线性复杂度追平Softmax

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RT-DETR改进策略【Conv和Transformer】| ICLR 2025 PolaLinearAttention 极性感知线性注意力 全符号交互 + 可学习降熵,线性复杂度追平Softmax

一、本文介绍

本文记录的是利用PolaLinearAttention极性感知线性注意力模块优化RT-DETR的目标检测网络模型

PolaLinearAttention通过Q/K极性分解、双路可学习符号加权融合与可学习幂函数降熵结合在保持线性复杂度的同时完整恢复Query-Key正负交互并生成低熵尖锐注意力。本文利用PolaLinearAttention模块,先将查询与键分解为正负分量建模全符号交互,再以可学习矩阵自适应加权同符号与反符号贡献,通过可学习幂函数降低注意力分布熵,对关键目标特征进行精准聚焦、抑制无效均匀权重与背景噪声干扰在注意力建模阶段实现完整特征关系与低熵尖锐分布的高效兼顾,摆脱传统线性注意力信息丢失与Softmax二次复杂度缺陷,显著提升视觉Transformer在分类、检测、分割任务中的精度与效率。


专栏目录:RT-DETR改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进

专栏地址:RT-DETR改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

文章目录

  • 一、本文介绍
  • 二、PolaLinearAttention 介绍
    • 2.1 设计出发点
    • 2.2 模块结构
    • 2.3 模块优势
  • 三、PolaLinearAttention的实现代码
  • 四、创新模块
    • 4.1 改进点1⭐
    • 4.2 改进点2⭐
    • 4.2 改进点3⭐
  • 五、添加步骤
    • 5.1 修改一
    • 5.2 修改二
    • 5.3 修改三
  • 六、yaml模型文件
    • 6.1 rtdetr-l版本
    • 6.2 rtdetr-resnet50版本
    • 6.3 rtdetr-resnet18版本
  • 六、成功运行结果

二、PolaLinearAttention 介绍

2.1 设计出发点

传统线性注意力仅保留非负特征,丢失 Query-Key 负向交互信息,导致注意力图熵高、区分度差;且缺少类似 Softmax 的尖锐性,权重分布过于平均,表达能力弱于原版自注意力。因此提出极性感知线性注意力 PolaLinearAttention,完整保留正负交互并降低熵值。

2.2 模块结构

PolaLinearAttention(极性感知线性注意力)结构:

  1. 极性分解:将 Q、K 拆分为正、负分量,建模同符号(正正、负负)与反符号(正负、负正)全交互;
  2. 双路可学习融合:按通道拆分 V 为两路,分别处理同符号/反符号响应,用可学习矩阵G s G^sG
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/21 21:31:41

嵌入式硬件安全模块(HSM)设计实战:从NXP A71CH选型到抗侧信道攻击

1. 项目概述:为什么我们需要一颗独立的“安全心脏”在物联网设备遍地开花的今天,安全问题已经从“加分项”变成了“生死线”。我见过太多项目,前期功能开发热火朝天,到了安全认证环节却漏洞百出,不得不推倒重来&#x…

作者头像 李华
网站建设 2026/6/21 21:28:47

3步搞定Windows风扇控制:告别显卡高温和CPU噪音的终极方案

3步搞定Windows风扇控制:告别显卡高温和CPU噪音的终极方案 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trendin…

作者头像 李华
网站建设 2026/6/21 21:27:50

钢结构围护的部分技术要求

钢结构围护的部分技术要求 1、GB 51022-2015 门式刚架轻型房屋钢结构技术规范 11.1.10 条文: 屋面板沿板长方向的搭接位置宜在屋面条上,搭接长度不应小于150mm,在搭接处应做防水处理; 墙面板搭接长度不

作者头像 李华
网站建设 2026/6/21 21:21:10

正交变换优化数据驱动可达性分析:降维与紧致化技术详解

1. 项目概述:当可达性分析遇上数据驱动在控制理论、机器人路径规划乃至金融风险评估等领域,我们常常需要回答一个核心问题:“系统从当前状态出发,在未来一段时间内,能否安全地到达某个目标区域,或者是否会不…

作者头像 李华
网站建设 2026/6/21 21:13:03

行为克隆中控制器增益的闭环性能分析与协同优化

1. 项目概述:当行为克隆遇上控制器增益在机器人、自动驾驶和游戏AI这些领域,我们常常会用到一种叫做“行为克隆”的技术。简单来说,就是让一个智能体(比如一个程序)去模仿专家(比如一个熟练的司机&#xff…

作者头像 李华
网站建设 2026/6/21 21:11:47

M68HC08低成本编程调试方案:从Class III接口到PE/CodeWarrior实战

1. 项目概述:为什么M68HC08至今仍有生命力在嵌入式开发的浩瀚世界里,新的MCU架构层出不穷,性能指标也日新月异。但如果你像我一样,在工业控制、老设备维护或者一些对成本极其敏感的教育项目中摸爬滚打过,你一定会对像F…

作者头像 李华