news 2026/6/9 21:23:35

ChartCap:利用大型数据集和新的评估指标抑制图表标题幻觉

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ChartCap:利用大型数据集和新的评估指标抑制图表标题幻觉

概述

该研究旨在确保整合视觉和语言的模型能够生成 “准确且信息丰富的图表说明(标题)”。
现有的图表标题数据集面临两大挑战。

首先,从论文和报告中提取的标题包含无法从图表图像中读取的无关信息。
其次,标题不能充分体现重要的见解,如坐标轴、图例和其他结构、最大值和趋势。

这些问题在模型中造成了 “幻觉”(halucinations),导致了错误的表述。
因此,作者构建了一个新的数据集–ChartCap,该数据集包含 56 万多张真实世界的图表,这些图表具有高质量的标题,对结构元素和重要见解没有过多或过少的表述,也没有无关信息。

我们还提出了一种新的衡量标准–视觉一致性得分,它可以根据生成的标题复制图表,并通过与原始图像进行比较来对其进行评估。
这样就能客观地衡量模型忠实、准确地描述实际图表的能力。

建议的方法

作者设计了一个四阶段自动生成管道来构建 ChartCap 数据集。

首先,只从数百万张图片中提取数据驱动的图表,不包括图表以外的图表(如概念图和示意图)。

然后,使用 GPT-4o 和其他工具识别图表类型和标题。

然后,根据为每种图表类型定义的模式,提取图例、坐标轴、极值和趋势等结构元素和见解。

在这一过程中,GPT-4o 和 Claude 3.5 Sonnet 分工合作,前者负责粗略的趋势识别,后者负责需要数字精确度的处理。

提取结果被编译成半结构化格式,最后转换成自然语言说明。

为了进一步保证质量,还引入了基于周期一致性的验证,即 “根据标题生成 Python 代码,并将重建的图表与原始图像进行比较”,而不是由人工直接检查所有内容。

这不仅简化了人工视觉检查,还能以低成本构建兼具准确性和全面性的大型数据集。

实验

实验将在 ChartCap 上训练的模型与现有的开源模型和商业模型进行了比较。

除了传统的 BLEU 和 ROUGE 外,还使用了建议的视觉一致性得分(VCS)和 OCRScore 作为评估指标。

结果显示,与传统模型相比,使用 ChartCap 微调的模型生成的字幕更准确、更翔实、更不虚假。

其中,Phi3.5-Vision-4B 和 InternVL2.5-8B 等开源模型在使用 ChartCap 进行微调后,甚至超过了商业 Claude 3.5 Sonnet。

它们还在 VisText 和 Chart-to-Text 等其他人工验证数据集上实现了零误差的高准确率,证明了它们的泛化能力。
此外,对人类评分的比较表明,在许多情况下,使用 ChartCap 训练的模型的输出结果比现有的人类撰写的标题更受欢迎。

这表明,ChartCap 比传统数据集更有效,可以为理解和解释真实世界的图表做出重大贡献。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 6:39:14

命令行esh模板引擎实战技巧与最佳实践

esh (Embedded SHell) 是一个轻量级的模板引擎,用于在任意模板中嵌入和执行 shell 命令。本文档系统性地介绍 esh 的核心概念、语法特性、高级技巧和实战应用,帮助开发者快速掌握配置文件动态生成和模板化处理的精髓。 📋 目录 一、快速开始…

作者头像 李华
网站建设 2026/6/9 16:13:02

HTMLProofer:一站式HTML质量验证终极解决方案

HTMLProofer:一站式HTML质量验证终极解决方案 【免费下载链接】html-proofer Test your rendered HTML files to make sure theyre accurate. 项目地址: https://gitcode.com/gh_mirrors/ht/html-proofer 在当今数字化时代,网站质量直接关系到用户…

作者头像 李华
网站建设 2026/6/9 17:03:29

SpringBoot集成Swagger:API文档自动生成的完整指南

SpringBoot集成Swagger:API文档自动生成的完整指南 【免费下载链接】springboot-guide SpringBoot2.0从入门到实战! 项目地址: https://gitcode.com/gh_mirrors/sp/springboot-guide 在现代Web开发中,前后端分离架构已经成为主流趋势。…

作者头像 李华
网站建设 2026/6/8 14:35:02

【SpringBoot】Spring IOC DI 五大注解 Bean 扫描路径 依赖注入

文章目录Ⅰ. 什么是 IOC 和 DI❓❓❓Ⅱ. 五大注解Ⅲ. 注解 BeanⅣ. 扫描路径 ComponentScanⅤ. 依赖注入一、三种注入方式 Autowired① 属性注入② 构造方法注入③ Setter方法注入三种注入方式的区别二、Autowired 存在的问题① Primary② Qualifier③ Resource⭐⭐⭐Ⅰ. 什么是…

作者头像 李华
网站建设 2026/6/8 15:00:36

一句话生成专业问卷?百考通AI平台让调研“零门槛、高效率”!

你是否曾因为不会设计问卷而放弃一个好选题?是否在写论文或做项目时,明明有清晰的研究问题,却卡在“怎么把它变成一道道科学的问题”?又或者,花了一整天做的问卷被导师或同事指出“逻辑混乱”“选项不全”“问题有引导…

作者头像 李华
网站建设 2026/6/8 19:31:46

3步征服iOS WebApp状态栏:打造完美沉浸式全屏体验

3步征服iOS WebApp状态栏:打造完美沉浸式全屏体验 【免费下载链接】Mars 腾讯移动 Web 前端知识库 项目地址: https://gitcode.com/gh_mirrors/mar/Mars 还在为iOS WebApp状态栏遮挡内容而苦恼吗?想要让你的Web应用拥有原生App一样的全屏视觉效果…

作者头像 李华