news 2026/4/17 19:27:12

2025ICLR-Honorable Mentions-DATA SHAPLEY IN ONE TRAINING RUN

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2025ICLR-Honorable Mentions-DATA SHAPLEY IN ONE TRAINING RUN

文章核心总结与创新点

主要内容

本文针对传统Data Shapley在大规模模型中存在的计算效率低、无法评估特定训练过程数据贡献的问题,提出了In-Run Data Shapley方法。该方法无需重复训练模型,通过在单次训练过程中累加各梯度更新迭代的Shapley值,实现对数据贡献的高效评估。文章通过理论推导(泰勒展开近似)和技术优化(幽灵点积、幽灵梯度-海森-梯度积技术),使方法在基础模型预训练场景中具备可行性,并通过实验验证了其在数据筛选、训练阶段贡献分析、生成式AI版权相关研究中的应用价值。

创新点

  1. 概念创新:提出In-Run Data Shapley,首次实现对特定训练过程的数据贡献评估,突破传统方法针对通用学习算法的局限,贴合实际部署需求。
  2. 效率优化:基于泰勒展开将全局效用分解为单迭代局部效用,结合“幽灵”系列技术,在单次训练中完成计算,一阶近似与常规训练耗时接近,二阶近似仅增加一倍耗时,远超传统方法效率。
  3. 应用拓展:首次将数据归因应用于基础模型预训练,揭示数据贡献的阶段依赖性、高质量数据集仍存在16%低价值数据等新洞察,为数据筛选和生成式AI版权分配提供理论支持。

翻译部分(Markdown格式)

Abstract

数据沙普利(Data Shapley)提供了一个原

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 6:28:43

LangFlow与地理位置服务结合:IP定位与地图展示

LangFlow与地理位置服务结合:IP定位与地图展示 在智能应用日益强调个性化和情境感知的今天,一个简单的IP地址早已不只是网络通信的标识符。它背后隐藏着用户的地理踪迹——从国家、城市到经纬度坐标,这些信息正被越来越多地用于安全分析、内容…

作者头像 李华
网站建设 2026/4/17 3:48:13

【程序员必看】自动驾驶大模型新王炸!强化学习+多模态思维链,小白也能秒变AI专家![特殊字符][特殊字符]

一、OmniDrive-R1:强化驱动的交织多模态思维链以实现值得信赖的视觉语言自动驾驶二、论文卡片本文提出了OmniDrive-R1,一种基于强化学习的端到端视觉语言模型框架,通过交错多模态链式思考机制,显著提高了自动驾驶中的推理性能和可…

作者头像 李华
网站建设 2026/4/16 15:01:47

Open-AutoGLM本地搭建常见问题大全(90%新手都会踩的8个坑)

第一章:Open-AutoGLM本地搭建概述Open-AutoGLM 是一个开源的自动化通用语言模型推理框架,支持在本地环境中部署并运行大语言模型,适用于私有化部署、离线推理和定制化开发。其核心优势在于模块化设计与轻量级服务架构,便于开发者快…

作者头像 李华
网站建设 2026/4/16 11:24:25

字谱Open-AutoGLM落地难题全解析(常见错误+最佳实践)

第一章:字谱Open-AutoGLM概述字谱Open-AutoGLM 是一个开源的自动化机器学习框架,专为中文自然语言处理任务设计。它集成了模型自动调优、数据预处理、特征工程和可解释性分析等核心功能,旨在降低开发者在构建高质量语言模型时的技术门槛。该框…

作者头像 李华