news 2026/2/2 22:33:13

医图论文 CVPR 2025 | 重磅!SKCDF:针对医学影像分割的语义知识解耦框架,小器官(如肾上腺)分割性能显著提升

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
医图论文 CVPR 2025 | 重磅!SKCDF:针对医学影像分割的语义知识解耦框架,小器官(如肾上腺)分割性能显著提升

点击下方“PapersAccepted”,选择加"星标"或“置顶

下载:公众号后台回复【MICCAI】,获取MICCAI 2025论文全集下载链接

在医学影像分析领域,半监督学习(SSL)凭借其减少标注成本的优势成为研究热点。然而,现有方法在处理类别不平衡的多器官分割任务时,常面临小器官分割精度低下甚至漏检的问题。近日,发表于CVPR'25的最新研究提出了一种基于语义知识互补的解耦框架(SKCDF),通过创新性的数据流解耦设计、语义知识互补机制和辅助平衡策略,在Synapse和AMOS两大权威数据集上实现了性能突破。

研究背景:半监督分割的双重挑战

医学图像分割对精准度要求极高,尤其是在多器官场景中,肾上腺、胆囊等小器官的分割结果直接影响临床诊断。当前半监督学习方法存在两大核心瓶颈:

  1. 数据流混淆问题:传统方法将标注数据与未标注数据混合输入模型,导致未标注数据的伪标签误差严重干扰解码器学习。编码器侧重特征提取,解码器负责语义决策,二者对标签精度的需求存在本质差异。

  2. 类别不平衡困境:医学图像中不同器官的体素占比差异可达100倍以上,模型易偏向学习大器官特征,小器官常出现分割缺失。现有重加权或重采样方法往往以牺牲大器官精度为代价。

图1:传统方法与SKCDF框架的核心差异对比。(a)传统方法混合数据流导致误差累积;(b)SKCDF的数据流解耦设计;(c)传统方法中数据交互缺失;(d)SKCDF的语义知识互补机制

方法架构:SKCDF框架的三重创新

SKCDF框架通过模块化设计实现了对上述问题的系统性解决,其整体架构如图2所示,核心创新包括数据流解耦框架、语义知识互补模块和辅助平衡分割头策略。

图2:SKCDF框架总体结构。包含共享编码器、双解码器(标注/未标注)、语义知识互补模块及四个分割头(主/辅助平衡)

1. 数据流解耦框架:各司其职的学习机制

框架采用"一编码器+双解码器"结构:

  • 共享编码器:从所有数据(标注+未标注)中学习通用特征(形状、纹理等),充分利用未标注数据的特征信息

  • 标注解码器:仅接收标注数据训练,专注学习精准语义分割规则

  • 未标注解码器:处理带伪标签的未标注数据,通过知识转移机制接收标注解码器的参数指导

这种设计既避免了未标注数据对语义决策的干扰,又通过指数移动平均(EMA)实现知识传递,形成"编码器学习→标注解码器提纯→未标注解码器优化"的良性循环。

2. 语义知识互补模块:双向赋能的特征交互

为实现标注与未标注数据的高效协同,模块设计了双重注意力机制(图3):

图3:语义知识互补模块结构。包含局部通道交叉注意力(捕捉细节)和全局通道交叉注意力(捕捉分布规律)

  • 局部通道交叉注意力:通过分块处理聚焦器官边缘等局部特征,增强小器官细节学习

  • 全局通道交叉注意力:基于整体特征分布建模,强化器官位置关联性

双向交互机制实现:

  • 用标注数据的精准语义指导未标注数据生成高质量伪标签

  • 用未标注数据的多样特征丰富标注数据的语义表示,缓解过拟合

3. 辅助平衡分割头策略:聚焦小器官的精准优化

针对类别不平衡,框架为每个解码器配置两个分割头:

  • 主分割头:保证整体分割性能,采用常规损失函数

  • 辅助平衡分割头:通过动态掩码强化小器官学习,掩码生成与器官体素占比成反比

训练过程中,辅助头对小器官区域赋予更高权重,且通过知识转移确保主分割头性能不受影响。这种设计在提升小器官精度的同时,避免了对大器官学习的削弱。

实验验证:两大数据集上的性能突破

研究在Synapse(20%标注率)和AMOS(5%标注率)数据集上进行了全面验证,主要结果如下:

1. 与现有方法的性能对比

在Synapse数据集上,SKCDF以64.27%的平均Dice值显著领先现有方法,尤其在小器官分割上表现突出:左肾上腺(+10.6%)、胰腺(+7.5%)、胃(+9.6%)。平均表面距离(ASD)降至1.45,表明边界分割更精准。

在AMOS数据集上,53.81%的平均Dice值较SOTA方法提升3.78%,食道、右肾上腺等复杂器官分割精度均有显著改善。

图4:可视化分割结果对比。SKCDF在小器官(如箭头所示的肾上腺)分割上表现出明显优势

2. 消融实验验证各组件有效性

实验配置

平均Dice提升

关键改进

基线伪标签框架

-

胆囊分割Dice为0%

+数据流解耦

+12.74%

整体性能显著提升

+语义知识互补

+1.77%

边界细节更清晰

+辅助平衡头

+7.17%

胆囊Dice提升至62.0%

消融实验表明,数据流解耦是性能提升的核心(+12.74%),辅助平衡头对小器官改善最显著,三者协同实现19.61%的整体提升。知识转移策略分析显示,"分割头→解码器→分割头"的传递顺序可获得最优性能(63.57%)。

研究意义与展望

SKCDF框架的创新点在于:

  1. 首次系统论证了数据流解耦对编码器/解码器分工的重要性

  2. 提出双向语义知识互补机制,实现标注与未标注数据的高效协同

  3. 设计不损害大器官性能的小器官增强策略

该研究为解决半监督医学图像分割中的数据利用与类别平衡问题提供了新思路,尤其适用于标注成本高昂的临床场景。未来可进一步探索3D特征交互的优化,以及在更复杂多模态医学影像中的应用。

论文信息

题目:A Semantic Knowledge Complementarity based Decoupling Framework for Semi-supervised Class-imbalanced Medical Image Segmentation 作者:Zheng Zhang, Guanchun Yin, Bo Zhang, Wu Liu, Xiuzhuang Zhou, Wendong Wang

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/27 15:47:29

Langchain-Chatchat问答系统灰度期间用户培训计划

Langchain-Chatchat问答系统灰度期间用户培训计划 在企业知识管理日益智能化的今天,如何在保障数据安全的前提下,让员工快速获取分散在各类文档中的关键信息,已经成为许多组织面临的共性难题。传统的搜索方式依赖关键词匹配,难以理…

作者头像 李华
网站建设 2026/1/29 14:06:18

我是如何将 IPL 数据转化为令人着迷的条形图竞赛

原文:towardsdatascience.com/how-i-turned-ipl-stats-into-a-mesmerizing-bar-chart-race-9ba48084b0c0?sourcecollection_archive---------6-----------------------#2024-10-06 数据故事化中创建引人入胜的动画可视化的逐步指南 https://tezansahu.medium.com/…

作者头像 李华
网站建设 2026/2/2 9:28:22

Langchain-Chatchat结合SkyWalking实现链路追踪

Langchain-Chatchat 结合 SkyWalking 实现链路追踪的深度实践 在企业级 AI 应用落地过程中,一个常被忽视但至关重要的问题浮出水面:系统“跑得起来”,却“看不透”。尤其是在基于私有知识库的智能问答场景中,用户一句简单的提问背…

作者头像 李华
网站建设 2026/1/30 17:47:02

【2025最新】掌上看家采集端下载安装教程:全平台图文步骤详解,手机与电脑都能轻松配置

在智能安防与远程监控场景中,手机端实时监控、远程回看、移动告警已经逐渐成为主流。许多用户在搜索相关软件时,都会接触到“掌上看家”这一应用。而在使用掌上看家过程中,若想实现实时视频采集、设备共享、远程传输,就必须先正确…

作者头像 李华
网站建设 2026/1/31 5:54:53

深度学习不同GPU性能比较

A100和A800A800和A100的区别是A800的NVlink带宽受到限制,多卡性能比A100差H100H100是A100的升级版,算力提升3倍RTX4090和A100比较:在单卡上4090比A100算力还更高一点。但是4090的显存会低很多,多卡性能会比4090强

作者头像 李华