news 2026/4/8 22:17:33

2025AAAI-DivShift: Exploring Domain-Specific Distribution Shift in Large-Scale, Volunteer-Collected

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2025AAAI-DivShift: Exploring Domain-Specific Distribution Shift in Large-Scale, Volunteer-Collected

文章主要内容和创新点总结

一、主要内容

  1. 研究背景:iNaturalist等公民科学项目提供的大规模志愿者收集生物多样性数据集,推动了机器学习在物种细粒度视觉分类等生物多样性监测任务中的性能提升,但这类数据存在地理、时间、分类学、观察者和社会政治等多种偏差,其对物种识别模型性能的影响尚不明确。
  2. 核心框架与数据集
    • 提出DivShift框架,用于量化特定领域分布偏移对机器学习模型性能的影响,通过测量数据集不同分区的域内与域外模型性能差异,并与标签分布偏移进行对比,评估偏差的影响。
    • 构建DivShift-NAWC数据集,包含北美西海岸近750万张iNaturalist图像,涵盖7500多种植物,按五种专家验证的偏差类型划分,为偏差影响评估提供受控案例。
  3. 研究方法:使用ResNet-18、ResNet-50和ViT等模型,基于多种精度指标(如单图像精度、物种精度、稀有度加权精度等),对比不同偏差分区下的物种识别性能,分析数据量、偏差类型与模型泛化能力的关系。
  4. 关键发现
    • 所有偏差分区均为弱偏差,模型性能变化小于标签分布偏移的预期影响。
    • 数据量对模型性能有正向影响,但提升幅度因偏差类型而异;例如,来自人类活动频繁区域、非挑战期、活跃观察者的数据集训练出的模型泛化能力更强。
    • 社会政治偏差导致跨区域模型性能下降最显著,但
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/6 16:40:22

鸿蒙应用瘦身指南:Flutter混合工程的包体积极致压缩实战

前言:被“臃肿”拖垮的用户体验 在鸿蒙应用市场,包体积(Bundle Size)直接决定了用户的下载转化率。对于集成了Flutter的鸿蒙应用,往往面临一个尴尬的局面:仅仅为了一个简单的Flutter页面,包体积…

作者头像 李华
网站建设 2026/4/8 5:42:13

LobeChat微博热搜话题参与建议

LobeChat微博热搜话题参与建议 在社交媒体节奏日益加快的今天,品牌和机构对热点事件的响应速度几乎成了“舆论生存”的关键。一个热搜话题从登上榜单到热度回落,往往只有几小时窗口期。如何在有限时间内快速产出有观点、有温度、有传播力的内容&#xff…

作者头像 李华
网站建设 2026/4/6 1:44:03

学生宿舍管理|基于springboot + vue学生宿舍管理系统(源码+数据库+文档)

学生宿舍管理 目录 基于springboot vue学生宿舍管理系统 一、前言 二、系统功能演示 ​三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue学生宿舍管理系统 一、前言 博主介绍&am…

作者头像 李华
网站建设 2026/3/31 17:58:54

物流信息管理|基于springboot + vue物流信息管理系统(源码+数据库+文档)

物流信息管理 目录 基于springboot vue物流信息管理系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue物流信息管理系统 一、前言 博主介绍&…

作者头像 李华