news 2026/6/23 8:44:14

人类记忆分类与 LLM 的核心映射

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
人类记忆分类与 LLM 的核心映射

将人类的认知记忆分类(语义记忆、情景记忆、程序性知识)与大语言模型(LLM)的架构和工程技术进行映射,是一个极其精妙且深刻的类比。

在认知心理学中,这些记忆组成了人类的整个智能系统;而在现代大模型工程(尤其是在 2026 年的 Agent 和 RAG 架构共识)中,它们分别对应着 LLM 的不同技术组件和数据流动方式

我们可以通过下面这个多维度的映射矩阵,来看透 AI 是如何模拟人类记忆系统的:

🗺️ 人类记忆分类与 LLM 的核心映射

+-------------------------------------------------------+ | 大语言模型记忆系统 | +-------------------------------------------------------+ | | [语义记忆 Semantic] [情景记忆 Episodic] [程序记忆 Procedural] • 预训练参数模型 • 向量数据库 (RAG) • 指令/对齐微调 (SFT/RLHF) • 通用事实与常识 • 短期/长期对话上下文 • Agent 工具调用与 Prompt 流程 | | +-------------------------------------------------------+

1. 语义记忆 (Semantic Memory) $\rightarrow$ LLM 的预训练参数 (Pre-trained Parameters)

  • 人类的语义记忆:指我们对外部世界的通用事实、常识、概念和语言规则的记忆。它脱离了特定的时间、地点和个人经历(例如:知道“巴黎是法国的首都”、“水的分子式是 $H_2O$”,但你不需要记住你是哪年哪月在哪学会这个知识的)。

  • LLM 的对应组件预训练阶段被编码进模型全局权重(Weights)的隐式知识库。

  • 工程表现:大模型在海量语料上做“下一词预测”后,数以亿计的参数矩阵自发形成的关于这个世界的条件概率分布。当你直接问 AI 一个常识性问题,它不需要查阅任何外部文档就能直接脱口而出,这就是在提取它的“语义记忆”。

2. 情景记忆 (Episodic Memory) $\rightarrow$ 动态上下文 (Context Window) 与 向量数据库 (RAG)

  • 人类的情景记忆:指关于个人经历、特定事件、时间、地点以及当时场景的记忆(例如:记住“你昨天早餐吃了什么”、“上个礼拜跟某位客户开会聊了哪些具体细节”)。它是高度有时效性、空间性和动态更新的。

  • LLM 的对应组件长文本上下文窗口(Context Window)以及外挂的检索增强生成(RAG/Vector DB)。

  • 工程表现

    • 短期情景记忆:存在于当前的 Prompt 会话中。AI 能记住你在前五轮对话里说过的私房话、传给它的具体报错截图,这些信息随着会话结束而清空。

    • 长期情景记忆:当 Agent 智能体将过去的聊天记录、用户的个人偏好快照、或者企业的实时交易日志(Log)切片存储到向量数据库中。在推理时,通过 Embedding 相似度检索,把这些“特定经历”重新塞进 Context 里提供给模型。

3. 程序性记忆 (Procedural Memory) $\rightarrow$ 微调 (SFT/DPO) 与 Agent 工作流 (Workflows)

  • 人类的程序性记忆:关于如何做某事的方法、步骤和技能的记忆,通常是自动化的“肌肉记忆”,难以用语言精确描述,但一旦学会就高度固化(例如:骑自行车、弹钢琴、打字、写代码的直觉)。

  • LLM 的对应组件监督微调(SFT)、强化学习(RLHF/RLAIF)、人类意图对齐、以及 Agent 内部的 Tools 调用链。

  • 工程表现

    • 这正是你前面提到的“将任务模式编码到参数中”。通过微调,大模型学到的不是某个具体的事实(语义记忆),而是学到了“行为范式”。

    • 比如:让模型学习“如何进行思维链(CoT)推理”、“如何把一段自然语言精准转化为标准的 JSON 格式输出”、或者“在什么情况下应该去调用 MCP 服务器上的 GitHub 工具”。这种按照既定逻辑去执行任务的底层模式,就是 AI 的程序性记忆。

📊 深度对比透视图

为了更直观地看清它们在工程落地时的生命周期与更新成本,我们可以将其梳理成一张技术对比表:

记忆类型人类认知表现LLM 工程落地技术信息存储位置写入/更新成本核心风险与痛点

Semantic

(语义记忆)

世界常识、词汇定义、客观规律。

基座预训练参数

(Base Model Weights)

散落于全连接层(FFN)和注意力矩阵中。

极高

(需要极其昂贵的算力进行重新训练)。

灾难性遗忘、知识滞后、事实性幻觉。

Episodic

(情景记忆)

个人经历、特定时间地点的事件细节。

Context Window

+ 向量数据库 (RAG)

内存/显存(动态)、外部外部数据库(静态)。

极低

(毫秒级,直接写入数据库或拼接 Context)。

召回准确率限制、上下文窗口长度天花板。

Procedural

(程序记忆)

技能、流程、干活的“肌肉记忆”。

指令微调 (SFT)

+ Agent 提示词骨架

对齐后的参数权重、代码硬编码的流程图。

中等

(需要高质量任务数据集与微调算力)。

过拟合(泛化能力丧失)、对未知任务束手无措。

💡 2026 年认知架构师(Cognitive Architect)的思考

在当前的智能体(Agent)系统设计中,真正的技术高手不会强求某一个组件包揽所有的记忆功能:

当你尝试去开发一个自动帮你分析金融行情并发送周报的 Agent 时,你的架构设计其实是在完美复刻人类的这三套记忆神经系统

  1. 你会挑选一个“语义记忆”极度发达的商业或开源大模型(如openai/gpt-oss-120b)作为大脑,确保它懂基本的金融术语。

  2. 你会编写一套严格的 Prompt 模版或通过微调固化它的“程序记忆”,训练它只要看到数据,就必须严格按照(分析 $\rightarrow$ 评估 $\rightarrow$ 总结)的步骤执行工具调用(Tool Use)。

  3. 每次运行时,你会通过 RAG 把最新的市场研报和该用户往期的投资历史(“情景记忆”)动态注入进去,确保它不会张冠李戴。

这三种记忆的有机结合,才让今天的 LLM 真正从一个简单的“文本生成器”跃升为了具有人类思维框架的“数字智能体”。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 8:39:24

React Router v6核心原理与工程实践指南

1. 这不是一次小更新,而是React Router的“重写级”重构 如果你最近在翻React生态的文档、刷前端技术群,或者面试时被问到“v5和v6最大的区别是什么”,大概率会听到一句:“v6是重写的”。但这句话背后藏着太多被轻描淡写带过的事实…

作者头像 李华
网站建设 2026/6/23 8:35:03

Kinetis SDK DSPI DMA/eDMA驱动实战:从原理到RTOS集成与问题排查

1. 项目概述与核心价值 在嵌入式开发领域,尤其是基于NXP Kinetis系列MCU的项目中,与外设进行高效、可靠的数据交换是家常便饭。SPI(Serial Peripheral Interface)作为最常用的同步串行总线之一,因其协议简单、全双工、…

作者头像 李华
网站建设 2026/6/23 8:33:07

ReAct、ReWOO与CoT:生产级Agent架构设计核心矛盾与落地实践

1. 这不是“加个插件就能跑”的玩具:Agent架构设计的本质矛盾很多人第一次听说ReAct、ReWOO或思维链(Chain-of-Thought, CoT),下意识反应是:“哦,又一个Prompt技巧?”——然后打开编辑器&#x…

作者头像 李华
网站建设 2026/6/23 8:28:13

Ubuntu 14.04 上 Icinga 2 监控部署与调优实战指南

1. 为什么在 Ubuntu 14.04 上坚持用 Icinga 而不是换新系统? Icinga 这个名字听起来像某种冰镇饮料,但对运维老手来说,它更像是一台永不疲倦的哨兵——尤其当你手头还压着一批跑在 Ubuntu 14.04 上的生产服务时。别急着翻白眼说“这系统都 EO…

作者头像 李华
网站建设 2026/6/23 8:26:33

Ubuntu 18.04 搭建 ownCloud 私有云盘全指南

1. 项目概述:在 Ubuntu 18.04 上亲手搭起属于自己的私有云盘 ownCloud 是我用过最“接地气”的私有云方案——它不像 Nextcloud 那样功能堆砌得让人眼花,也不像 Seafile 那样对存储结构有强绑定,而是在 Apache MySQL PHP 这套经典 LAMP 栈上…

作者头像 李华
网站建设 2026/6/23 8:13:25

【课程设计/毕业设计】基于 Python Web 的汽车销售数据可视化系统搭建与实现 汽车销售数据可视化展示与数据分析系统设计【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华