news 2026/3/22 8:43:53

Meta:LLM预填充上下文缓存策略

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Meta:LLM预填充上下文缓存策略

📖标题:Let’s (not) just put things in Context: Test-Time Training for Long-Context LLMs
🌐来源:arXiv, 2512.13898

🌟摘要

训练和架构策略的进展使 LLM 在上下文长度上具有数百万个标记。然而,经验证据表明,这种长上下文 LLM 可以比可以可靠地使用的文本消耗更多的文本。另一方面,已经表明,在涉及多步推理的具有挑战性的任务上,推理时间计算可用于扩展 LLM 的性能,通常是通过生成思维标记。通过对沙盒长上下文任务的受控实验,我们发现这种推理时间策略显示出快速递减的回报,并且在长上下文中失败。我们将这些失败归因于分数稀释,这是静态自注意力固有的现象。此外,我们表明当前的推理时间策略不能在一定条件下检索相关的长上下文信号。我们提出了仅查询测试时间训练 (qTTT),它通过对给定上下文的目标梯度更新,可证明克服了静态自注意力的局限性。我们发现,如何花费推理时间计算的简单转变会导致模型和长上下文基准的性能持续显着提高。qTTT 在 LongBench-v2 和 ZeroScrolls 基准的子集上平均导致 Qwen3-4B 的大量 12.6% 和 14.1% 点改进。结论是实用的:对于长上下文,少量特定于上下文的训练比当前推理时间缩放策略(如产生更多思考标记)更好地使用推理计算。

🛎️文章简介

🔸研究问题:如何有效利用推理时计算资源来改善长上下文的检索和推理能力?
🔸主要贡献:论文提出了一种新的测试时训练方法(qTTT),通过在长上下文任务中进行查询更新,显著提高了模型的性能。

📝重点思路

🔸引入查询仅测试时训练(qTTT),通过一次预填充缓存键值对(K/V),然后仅对查询投影进行轻量级梯度更新,从而减少了计算开销。
🔸利用实验分析验证了传统的推理时间计算策略在长上下文中的表现不佳,强调了qTTT的优势。
🔸通过设置受控的合成任务,深入研究了长上下文失败的原因,如“评分稀释”现象,并提出qTTT可以有效应对这一挑战。
🔸采用多种真实世界数据集(如ZeroScrolls和LongBench-v2)进行评估,覆盖多个任务和模型规模(1.7B到8B参数)。

🔎分析总结

🔸实验结果表明,qTTT在绝大多数测试场景下都能显著超越标准的推理解码和基于“思考”代币的策略,尤其是在代码理解和多文档问答等多跳推理任务中,性能提升超过20%。
🔸随着上下文长度的增加,传统方法在性能上呈现迅速下降的趋势,而qTTT则保持了较高的准确率,显示出其在长上下文处理上的有效性。
🔸在结构固定、不改变预训练和输入数据的情况下,qTTT成功提高了目标与干扰物之间的分离度,缓解了长上下文推理中的问题。
🔸qTTT方法相较于传统推理时间计算的思路具有更低的计算费用,同时提升了模型在长文档情境下的性能。

💡个人观点

论文的创新点在于高效的计算调整策略,通过单次填充来建立一个持久的上下文缓存,并进行针对性的查询调整,以优化长上下文的推理性能。

🧩附录


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/13 16:08:57

介观交通流仿真软件:VISSIM (介观模式)_(9).公交系统仿真

公交系统仿真 在城市交通中,公交系统是重要的组成部分,其运行效率直接影响城市的整体交通状况。介观交通流仿真软件VISSIM提供了丰富的功能来模拟公交系统的运行,包括公交线路的设置、公交车辆的动态行为、公交优先策略的实施等。本节将详细介…

作者头像 李华
网站建设 2026/3/13 10:33:34

django基于Python员工管理系统设计开发实现

背景与意义 技术背景 Django是一个基于Python的高级Web框架,采用MTV(Model-Template-View)设计模式,内置ORM、表单处理和用户认证等功能。Python因其简洁语法和丰富的库生态(如Pandas、NumPy)&#xff0c…

作者头像 李华
网站建设 2026/3/12 23:08:19

基于django协同过滤算法的音乐推荐播放器设计开发实现

背景与意义音乐推荐系统在数字化时代扮演着重要角色,用户面对海量音乐内容时,个性化推荐能有效提升体验。协同过滤算法作为推荐系统的核心技术之一,通过分析用户行为数据(如播放记录、评分)挖掘相似用户或物品的关联性…

作者头像 李华
网站建设 2026/3/13 19:08:39

智慧公路边坡灾害监测 山体滑坡监测数据集 地质灾害AI解决方案 滑坡和落石灾害识别 自然灾害监测图像数据集 改进yolo第10312期

滑坡数据集数据集核心信息表信息类别具体内容数据集类别目标监测;包含 1个核心标注类别:、landslide(英文)、滑坡(中文)数据数量总计 6709 张图像数据集格式种类计算机视觉任务通用格式(支持实例…

作者头像 李华