news 2026/6/26 2:22:20

agent的记忆怎么设计

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
agent的记忆怎么设计

agent为什么需要记忆?

LLM本身是无状态的,上下文窗口context有限,每次推理调用都是成本

有记忆能补充上下文,依据这个记忆来整合推理,而非每次都从新开始

解决:当前会话内的上下文连贯性+跨会话的知识持久化

对应短期记忆和长期记忆

1、短期记忆的载体是LLM 的context window。包括在这次会话中用户的输入、工具调用和模型输出。如果对话边长,整个的内容太多

3种方式控制context

  • 上下文缩减,对历史的信息做摘要或整合,把细节丢掉换空间(可能存在摘要的完整性和准确性问题
  • 上下文卸载,把完整内容存到外部存储,context留引用的ID,需要时候再取(把记忆内容放到另一个空间,可能存在检索不准的问题?
  • 上下文隔离,多agent架构拆给子agent,每个agent只有自己那部分精简指令,主agent只收结果(记忆也设计多agent?每个agent还要处理自己的prompt和记忆

【Langchain摘要,google ADK压缩窗口,agentscope渐进压缩策略】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/26 2:22:13

Suricata深度流量分析:解密HTTPS与高级威胁狩猎实战指南

1. 项目概述:从“看热闹”到“看门道”的流量分析进阶在网络安全这个行当里干了十几年,我见过太多同行把流量分析工具当“黑盒子”用。抓个包,导进Suricata或者Wireshark,看着花花绿绿的告警弹窗,要么一头雾水&#xf…

作者头像 李华
网站建设 2026/6/26 2:20:12

flink统计文本单词数量

1.flink统计文本单词数量package com.ycl;import org.apache.flink.api.common.functions.FlatMapFunction; import org.apache.flink.api.java.ExecutionEnvironment; import org.apache.flink.api.java.operators.AggregateOperator; import org.apache.flink.api.java.opera…

作者头像 李华
网站建设 2026/6/26 2:18:34

lark-cli 设计:Raw、资源 API、Shortcut

先看结论 lark-cli 不是简单把飞书 API 包一层命令,而是把复杂 SaaS 平台拆成三种 CLI 能力: 资源 API:把平台 OpenAPI 元数据映射成 service resource method,用于结构化覆盖。Raw API:保留 HTTP method OpenAPI p…

作者头像 李华
网站建设 2026/6/26 2:16:29

2026实测盘点:16款降AI率工具测评,论文安全过关就靠它!

随着AI写作技术的迅猛发展,越来越多的学术创作者开始依赖各类智能工具提升写作效率。然而,2026年各大高校与科研机构对AIGC内容的检测标准愈发严格,论文中哪怕一丝一毫的AI痕迹都可能成为被质疑的隐患。在这样的背景下,如何有效降…

作者头像 李华
网站建设 2026/6/26 2:14:41

你的好,要给对的人

我们总习惯把善意和温柔分给身边的人,以为真心能换来真心,却常常忽略了一个现实:不是所有人都懂得珍惜你的好。有些人会把你的付出当成理所当然,你给得越多,他们越得寸进尺;有些人会把你的温柔当成软弱&…

作者头像 李华
网站建设 2026/6/26 2:13:11

PyTorch 张量计算与自动微分:从底层机制到工程实践

PyTorch 张量计算与自动微分:从底层机制到工程实践 一、当训练循环遇上计算图断裂:张量与梯度的真实痛点 在工业级深度学习项目中,PyTorch 的动态计算图机制既是灵活性的来源,也是工程事故的高发区。一个典型的场景:在…

作者头像 李华