agent的记忆怎么设计-洪萨配资

agent为什么需要记忆？

LLM本身是无状态的，上下文窗口context有限，每次推理调用都是成本

有记忆能补充上下文，依据这个记忆来整合推理，而非每次都从新开始

解决：当前会话内的上下文连贯性+跨会话的知识持久化

对应短期记忆和长期记忆

1、短期记忆的载体是LLM 的context window。包括在这次会话中用户的输入、工具调用和模型输出。如果对话边长，整个的内容太多

3种方式控制context

上下文缩减，对历史的信息做摘要或整合，把细节丢掉换空间（可能存在摘要的完整性和准确性问题
上下文卸载，把完整内容存到外部存储，context留引用的ID，需要时候再取（把记忆内容放到另一个空间，可能存在检索不准的问题？
上下文隔离，多agent架构拆给子agent，每个agent只有自己那部分精简指令，主agent只收结果（记忆也设计多agent?每个agent还要处理自己的prompt和记忆

【Langchain摘要，google ADK压缩窗口，agentscope渐进压缩策略】

1. 项目概述：从“看热闹”到“看门道”的流量分析进阶在网络安全这个行当里干了十几年，我见过太多同行把流量分析工具当“黑盒子”用。抓个包，导进Suricata或者Wireshark，看着花花绿绿的告警弹窗，要么一头雾水&#xf…

李华

先看结论 lark-cli 不是简单把飞书 API 包一层命令，而是把复杂 SaaS 平台拆成三种 CLI 能力： 资源 API：把平台 OpenAPI 元数据映射成 service resource method，用于结构化覆盖。Raw API：保留 HTTP method OpenAPI p…

李华

随着AI写作技术的迅猛发展，越来越多的学术创作者开始依赖各类智能工具提升写作效率。然而，2026年各大高校与科研机构对AIGC内容的检测标准愈发严格，论文中哪怕一丝一毫的AI痕迹都可能成为被质疑的隐患。在这样的背景下，如何有效降…

李华

我们总习惯把善意和温柔分给身边的人，以为真心能换来真心，却常常忽略了一个现实：不是所有人都懂得珍惜你的好。有些人会把你的付出当成理所当然，你给得越多，他们越得寸进尺；有些人会把你的温柔当成软弱&…

李华

PyTorch 张量计算与自动微分：从底层机制到工程实践一、当训练循环遇上计算图断裂：张量与梯度的真实痛点在工业级深度学习项目中，PyTorch 的动态计算图机制既是灵活性的来源，也是工程事故的高发区。一个典型的场景：在…

李华

Suricata深度流量分析：解密HTTPS与高级威胁狩猎实战指南