news 2026/5/8 16:21:34

YOLO26改进12:SPPF-LSKA:注意力机制改进SPPF,增强多尺度特征提取能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLO26改进12:SPPF-LSKA:注意力机制改进SPPF,增强多尺度特征提取能力

论文介绍

摘要

视觉注意力网络(VAN)中的大核注意力(LKA)模块已被证明在一系列视觉任务中表现出卓越性能,甚至超越视觉变换器(ViTs)。然而,LKA模块中的深度卷积层在卷积核尺寸增大时,计算量和内存占用呈二次方增长。为缓解这一问题,并支持在VAN的注意力模块中使用极大卷积核,本文提出了一种大分离核注意力模块(LSKA)。LSKA将深度卷积层的二维卷积核分解为级联的水平与垂直一维核。相比标准LKA设计,该分解方法可直接在注意力模块中使用大核深度卷积层,无需额外模块。
实验表明,VAN中提出的LSKA模块在性能上与标准LKA模块相当,同时降低了计算复杂度和内存占用。研究还发现,随着核尺寸增大,LSKA设计使VAN更倾向于关注物体形状而非纹理。此外,本文首次在ImageNet的五种损坏版本数据集上系统评估了VAN中的LKA与LSKA、ViTs及近期ConvNeXt的鲁棒性。
大量实验结果表明,随着核尺寸增大,VAN中的LSKA模块显著降低了计算复杂度和内存占用,同时在物体识别、检测、语义分割及鲁棒性测试中优于ViTs和ConvNeXt,并与VAN中的LKA模块性能相当。

文章地址:论文地址

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/8 16:21:05

豆包“炒股”翻车,程序员该为AI的“幻觉”背锅吗?

20万入市一周亏5万:当大模型开始“一本正经胡说八道”,程序员该反思什么? 最近,一则“豆包虚假业绩信息坑惨股民”的新闻在技术圈和金融圈炸了锅。一位股民因为信任 AI 生成的“虚假盈利数据”盲目入市,结果一周亏掉 5 万,换来的是客服一句回复:“生成内容不建议作为专…

作者头像 李华
网站建设 2026/5/8 16:21:05

基于springboot鞍山钢峰风机人力资源管理系统

前言 本文设计并实现了一款基于Spring Boot框架的鞍山钢峰风机人力资源管理系统,旨在解决传统人力资源管理中效率低、操作繁琐等问题。系统采用B/S架构模式,以Java为开发语言,结合MySQL数据库进行数据存储与管理,确保系统具备高稳…

作者头像 李华
网站建设 2026/4/28 11:50:40

数据复制技术在大数据风控中的应用

数据复制技术在大数据风控中的应用 1. 引入与连接 1.1 引人入胜的开场 想象一下,一家金融科技公司正准备向一位新客户发放一笔小额贷款。在做出决策之前,他们需要评估这位客户的信用风险。在这个大数据时代,公司手头拥有海量的数据&#xff0…

作者头像 李华
网站建设 2026/5/5 17:59:43

基于微信小程序的健康体检预约系统开题报告

目录项目背景与意义系统功能概述技术方案创新点预期成果项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作项目背景与意义 微信小程序健康体检预约系统旨在解决传统体检预约流程繁琐、信息不对称等问题。通过…

作者头像 李华
网站建设 2026/5/6 18:58:14

基于微信小程序的创新互动教学的设计与实现开题报告

目录 研究背景与意义研究目标研究内容创新点预期成果进度计划 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 研究背景与意义 微信小程序凭借其免安装、跨平台、开发成本低等优势,在教育领域…

作者头像 李华