news 2026/5/10 20:48:04

【中国海洋大学-蔡青组-AAAI26】SEMC:用于超声图像标准平面识别的结构增强型混合专家对比学习

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【中国海洋大学-蔡青组-AAAI26】SEMC:用于超声图像标准平面识别的结构增强型混合专家对比学习

文章:SEMC: Structure-Enhanced Mixture-of-Experts Contrastive Learning for Ultrasound Standard Plane Recognition

代码:https://github.com/YanGuihao/SEMC

单位:中国海洋大学


一、问题背景:超声标准平面识别,难在哪?

超声检查的核心是“找对角度”,但实际操作中难题重重:

  1. 图像本身不“给力”:超声图有斑点噪声、对比度低,器官边界模糊,想精准识别结构本身就难;

  2. 同类不同样,异类却相似:同一标准平面的图像可能因扫描角度、医生操作不同差异显著(比如同一肝脏平面,不同医生拍的样子大相径庭),而不同平面的图像又可能因为边界模糊显得很像,需要精细区分;

  3. 现有AI有短板:之前的AI模型要么只关注深层语义特征,忽略了图像里的浅层结构细节(比如器官轮廓、血管走向),要么没法通过对比学习捕捉到细微差异,导致识别准确率不够稳定。

这些问题直接影响诊断准确性,比如产检中胎儿生长指标测量、肝脏病变筛查等,都可能因标准平面识别不准出现误差。

二、方法创新:SEMC框架+LP2025数据集,双管齐下

为了解决上述痛点,研究团队推出了“SEMC框架”和“LP2025肝脏超声数据集”,核心创新点有两个:

1. SEMC框架:让AI既懂“结构”又懂“区分”

这个框架就像给AI配了“双引擎”,还请了“多位专家”协作:

  • 第一引擎:语义-结构融合模块(SSFM):之前的AI只看深层特征,好比“只见森林不见树木”。这个模块专门把浅层结构细节(比如器官轮廓、血管分支)和深层语义特征(比如这是肝脏左叶、那是门静脉)对齐融合,让AI既能看清细节,又能理解整体;

  • 第二引擎:混合专家对比识别模块(MCRM):相当于给AI安排了3个“专业小助手”,各自专注不同的特征维度,再通过协作做对比学习——既让同类平面的识别结果更统一,又让不同平面的差异更明显。同时还设计了自适应权重机制,不用人工调参,AI能自己根据图像难度调整学习重点。

2. LP2025数据集:填补数据空白

现有公开超声数据集稀缺,研究团队专门打造了高质量肝脏超声数据集:

  • 包含9369张图片,覆盖6种肝脏关键标准平面,还有4626张非标准平面图像(模拟真实临床场景);

  • 所有图片都由5年以上经验的超声医生标注,经过多轮交叉审核、共识验证,确保标签准确,还做了患者信息匿名化处理,兼顾实用性和隐私保护。

三、实验结果:性能碾压主流方法,多场景都好用

研究团队在3个数据集上做了测试,结果都很亮眼:

  1. 胎儿超声数据集(FPUS23):准确率达到95.78%,比第二名的主流模型高0.26%,F1-score更是达到95.06%,在胎儿头、腹部、股骨等标准平面识别中表现突出;

  2. 心脏超声数据集(CAMUS):准确率82.13%,F1-score80.93%,远超其他模型,证明在心脏两腔、四腔等复杂平面识别中同样靠谱;

  3. 自制肝脏数据集(LP2025):准确率82.30%,比现有方法高2.23%,F1-score79.32%,在6种肝脏标准平面和非标准平面的区分中优势明显。

四、优势与局限:实用但仍有提升空间

核心优势

  1. 兼顾细节与整体:首次把浅层结构和深层语义结合,解决了超声图像“细节难辨、同类差异大”的痛点;

  2. 泛化能力强:在胎儿、心脏、肝脏3类不同超声场景中都表现优异,不用针对单一部位重新训练;

  3. 开源共享:代码和数据集都已公开(https://github.com/YanGuihao/SEMC),能推动整个领域的研究进展;

  4. 临床适配性高:数据集包含非标准平面,模拟真实临床环境,模型鲁棒性强,更容易落地应用。

现存局限

  1. 数据范围有限:目前LP2025只覆盖肝脏6种标准平面,未来还需要扩展到更多器官(比如肾脏、甲状腺)和更多临床场景;

  2. 实时性待优化:框架包含多个专家分支和融合模块,虽然准确率高,但推理速度还有提升空间,需要进一步轻量化才能适配超声实时检查的需求;

  3. 极端情况表现未知:对于严重噪声、器官畸形等极端病例,模型的识别效果还需要更多临床数据验证。

五、一句话总结

SEMC框架通过“结构+语义融合”和“多专家对比学习”,解决了超声标准平面识别的核心痛点,搭配开源的高质量LP2025数据集,为临床超声AI辅助诊断提供了更精准、更实用的新方案!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 19:58:30

伯乐在线招聘贴植入:招AI工程师,要求熟悉DDColor等模型

伯乐在线招聘贴植入:招AI工程师,要求熟悉DDColor等模型 在数字时代,一张泛黄的老照片可能承载着几代人的记忆。然而,当这些黑白影像被扫描进电脑时,我们面对的不仅是像素的缺失,更是色彩语境的断裂——谁还…

作者头像 李华
网站建设 2026/5/9 15:54:51

核心要点:USB 2.0接口定义引脚说明中的阻抗匹配要求

USB 2.0 差分信号设计:从引脚定义到阻抗匹配的实战指南你有没有遇到过这样的情况?USB 设备在实验室里工作得好好的,一拿到现场就频繁断连、传输丢包。抓包一看,满屏都是 CRC 错误,重试次数飙升——可原理图没错&#x…

作者头像 李华
网站建设 2026/5/9 20:14:13

Amplitude数据分析:发现用户在DDColor中最常卡顿环节

Amplitude数据分析:发现用户在DDColor中最常卡顿环节 在AI图像修复工具日益普及的今天,越来越多普通人开始尝试用技术唤醒老照片中的记忆。然而,即便模型能力已经足够强大,许多用户依然会在操作过程中“卡住”——不是不知道下一步…

作者头像 李华
网站建设 2026/5/10 17:17:45

阿里云OSS存储DDColor模型文件,保障高速稳定下载

阿里云OSS存储DDColor模型文件,保障高速稳定下载 在老照片数字化浪潮席卷家庭影像与文化遗产修复的今天,一张泛黄的黑白旧照只需几秒钟就能重焕色彩——这背后并非传统修图师的手工上色,而是由AI驱动的智能修复流程。其中,DDColor…

作者头像 李华
网站建设 2026/5/9 21:29:38

支付宝/微信支付接入降低国内用户购买门槛

支付宝/微信支付接入降低国内用户购买门槛 在如今的中国,打开手机扫码付款早已成为人们生活的日常动作。无论是街边小摊买早餐,还是线上订阅AI工具服务,移动支付都扮演着“交易入口”的角色。对于开发者而言,如果一个面向国内用户…

作者头像 李华
网站建设 2026/5/9 21:00:54

点击运行没结果?查看日志定位DDColor执行中断原因

点击运行没结果?查看日志定位DDColor执行中断原因 在老照片修复逐渐成为AI图像处理热门应用的今天,越来越多用户开始尝试使用像 DDColor 这样的智能上色模型,配合 ComfyUI 这类可视化工具,一键将泛黄的黑白影像还原为生动的彩色画…

作者头像 李华