AI Agent 的记忆系统：短期记忆 vs 长期记忆，一文讲透

发布时间：2026/6/14 18:28:49

AI Agent 的记忆系统短期记忆 vs 长期记忆一文讲透一、为什么 Agent 需要记忆你有没有遇到过这种情况和 AI 聊了半天它突然失忆了前面说过的事完全不记得或者每次打开新对话都要重新自我介绍一遍。这背后的根本原因是大模型本身是无状态的——它不会自动记住任何东西。每次调用它只能看到你这一次传给它的内容过完即忘。但一个真正好用的 AI Agent必须能记事:记住你这轮对话前面说了什么不然没法多轮交流记住你是谁、喜欢什么不然每次都像初次见面记住之前做过的任务、学到的经验不然永远在重复犯错给 Agent 加上记忆系统就是让它从金鱼记忆变成靠谱助理的关键。而记忆主要分两类短期记忆和长期记忆。二、短期记忆Short-term Memory2.1 它是什么短期记忆当前这轮对话/任务的上下文。它对应的就是模型的「上下文窗口」里那些对话历史。打个比方短期记忆就像你和人聊天时脑子里的当前话题——这次聊天结束、或者话题切换太久它就淡忘了。你我叫小明在做一个电商项目 AI好的小明关于电商项目有什么可以帮你你帮我设计数据库 ← AI 还记得你叫小明、在做电商你新开一个对话你好 ← AI 不记得小明了短期记忆没了2.2 怎么实现最直接的方式把历史对话拼接到每次请求里。# 短期记忆维护一个 messages 列表messages[{role:user,content:我叫小明},{role:assistant,content:你好小明},{role:user,content:我刚才说我叫什么},# 它能答对]2.3 核心挑战上下文窗口装不下对话越长历史越多迟早会超出上下文窗口而且 Token 成本飙升。常见应对策略做法滑动窗口只保留最近 N 轮对话旧的丢掉摘要压缩把早期对话总结成一段话替代原文混合近期保留原文远期保留摘要三、长期记忆Long-term Memory3.1 它是什么长期记忆跨对话、跨会话持久保存的信息。关掉重开、过了一周它依然记得。打比方长期记忆就像你写在笔记本里的东西——不依赖当前在不在聊需要时翻出来看。它通常存储用户画像你的名字、偏好、习惯“小明喜欢用 Python、讨厌过度设计”历史事实之前发生过的关键事件、做过的决定经验知识从过往任务中学到的方法、踩过的坑3.2 怎么实现长期记忆不能塞在上下文里太多了而是存到外部需要时再检索回来。最主流的方式就是向量数据库检索——这其实就是 RAG 的思路用在了记忆上存入把记忆小明喜欢 Python转成向量存进向量库 ↓ 读取新对话时根据当前话题检索相关记忆拼进上下文 ↓ 模型我记得你喜欢 Python那这个方案就用 Python 写# 长期记忆的极简示意# 1. 存把重要信息写入向量库memory_db.add(用户小明偏好 Python反感过度设计,user_idxiaoming)# 2. 取新会话开始时检索该用户的相关记忆memoriesmemory_db.search(query当前问题,user_idxiaoming,top_k3)# 3. 把检索到的记忆拼进 system promptsystem_promptf关于该用户你已知{memories}\n请基于这些信息回答。3.3 进阶记忆的读 / 写 / 更新成熟的长期记忆系统不只是存还要管理写入时机哪些信息值得记不是所有对话都要存更新/纠正“小明换成 Go 了”——旧记忆要能更新遗忘机制过时、无用的记忆要清理否则越积越乱四、短期 vs 长期一张表看清维度短期记忆长期记忆范围当前对话/任务跨对话、永久存在哪上下文窗口对话历史外部存储向量库/数据库生命周期对话结束就没了持久保存典型内容刚才聊的内容用户画像、历史经验主要挑战窗口装不下 → 压缩/裁剪何时写、怎么检索、如何更新类比脑子里的当前话题写在笔记本上的东西五、一个完整 Agent 的记忆是怎么协作的真实的 Agent 通常两种记忆一起用用户提问 ↓ ① 从【长期记忆】检索相关信息用户偏好、历史经验 ↓ ② 加上【短期记忆】本轮对话历史 ↓ ③ 一起组成上下文 → 喂给模型 → 生成回答 ↓ ④ 判断本轮有没有值得长期记住的新信息有 → 写入【长期记忆】举个例子——一个编程助手 Agent长期记忆记得你常用 Python、项目用 FastAPI、不喜欢复杂方案短期记忆记得这轮你正在调试一个登录接口的报错协作效果它给的方案既贴合你的长期偏好Python 简洁又紧扣当前问题登录报错这就是有记忆和没记忆Agent 的体验鸿沟。六、几个实践建议#建议说明1先做好短期记忆多数应用把多轮对话摘要压缩做好就够用了2长期记忆按需引入真的需要跨会话记住用户时再上别过度设计3不是什么都要记长期记忆只存高价值信息垃圾进垃圾出4记忆也要检索得准长期记忆本质是 RAGEmbedding 和检索质量决定效果5注意隐私合规存用户信息要考虑授权、加密、可删除6善用现成方案有 Mem0、LangChain Memory 等开源库不用全从零造七、总结大模型本身无状态记忆是外挂上去的能力短期记忆当前对话上下文存在窗口里靠压缩/裁剪管理长期记忆跨会话持久信息存在外部向量库靠检索调用本质是 RAG好的 Agent 两者结合长期记忆提供你是谁短期记忆提供我们在聊什么实践原则先把短期做扎实长期按需引入只记高价值信息一句话记忆系统是让 AI Agent 从一次性工具进化成懂你的长期助手的核心。理解了短期与长期记忆的分工你就掌握了构建实用 Agent 的关键一环。相关阅读长期记忆与我之前写的《RAG 知识库实战》《向量数据库选型》《Embedding 指南》《上下文工程》是同一条技术线建议串起来看。

Wayback Machine浏览器扩展：让消失的网页永远触手可及的数字时光机

Wayback Machine浏览器扩展：让消失的网页永远触手可及的数字时光机【免费下载链接】wayback-machine-webextension A web browser extension for Chrome, Firefox, Edge, and Safari 14. 项目地址: https://gitcode.com/gh_mirrors/wa/wayback-machine-webextens…

2026/6/14 18:28:28 阅读更多

SAP FIORI实战：手把手教你用ICMR App搞定公司间对账（附操作截图）

SAP FIORI实战：ICMR App公司间对账全流程指南财务月末关账时最头疼的莫过于关联公司往来账目核对——两边系统数据不一致、手工匹配效率低下、差异原因难以追踪。ICMR（Intercompany Matching and Reconciliation）作为SAP FIORI平台的核心对账…

2026/6/14 18:27:27 阅读更多

Google 爬虫工作原理，及用Python实现完整的Google爬虫

更多内容请见：《爬虫和逆向教程》 - 专栏介绍和目录文章目录一、 Google 爬虫是如何获取数据的？ 1. 发现 URL (URL Discovery) 2. 抓取 3. 处理与索引 4. 排名二、用 Python 实现一个完整的 Google 爬虫 1. 模拟 Googlebot 抓取普通网页（抓取与解析） 2. 搜索引擎爬虫（…

2026/6/14 18:26:26 阅读更多

如何在Kodi中实现115网盘原码播放：完整安装配置指南

如何在Kodi中实现115网盘原码播放：完整安装配置指南【免费下载链接】115proxy-for-kodi 115原码播放服务Kodi插件项目地址: https://gitcode.com/gh_mirrors/11/115proxy-for-kodi 你是否厌倦了将115网盘中的高清视频下载到本地才能观看？是否希…

2026/6/14 19:45:59 阅读更多

GR3-Fourier V10.2主要内容包括：1）无传感器磁链观测器的C语言实现，含电阻/电感参数和滤波系数；2）三相电流克拉克变换的优化算法；3）动态内存池管理机制；4）电网锁相环幅值归一化处理。

GR3-Fourier V10.2 绝密工业底层硬核密档本文档披露了工业级电机控制系统的核心底层代码及关键参数配置，主要内容包括：1）无传感器磁链观测器的C语言实现，含电阻/电感参数和滤波系数；2）三相电流克拉克变换的…

2026/6/14 19:45:59 阅读更多

MapLibre GL JS第49课：用表达式创建渐变线

📌 学习目标掌握用表达式创建渐变线的实现方法理解相关API的使用能够独立完成类似功能开发 🎯 核心概念使用表达式创建渐变线条。 💻 完整代码代码示例 <!DOCTYPE html> <html lang"en"> <head><…

2026/6/14 19:45:39 阅读更多

自制串口和 VGA “万能控制台”：从旧设备改造到终端模拟器适配

老古董计算机研究项目背景时光回溯，精彩重放。2026 年 6 月 13 日星期六，相关项目围绕带有串口控制台的系统展开。此前拖着老旧的 CRT 终端，或者占用带串口的 Mac 笔记本的方式已经显得过时，需要一个独立、更便携且轻便些的设备。…

2026/6/14 19:45:19 阅读更多

5分钟搭建Windows AirPlay接收器：免费开源方案全解析

5分钟搭建Windows AirPlay接收器：免费开源方案全解析【免费下载链接】airplay2-win Airplay2 for windows 项目地址: https://gitcode.com/gh_mirrors/ai/airplay2-win 还在为苹果设备无法无线投屏到Windows电脑而烦恼吗？Airplay2-Win开源项目彻…

2026/6/14 19:44:58 阅读更多

3分钟快速上手：LibreDWG免费DWG文件转换终极指南

3分钟快速上手：LibreDWG免费DWG文件转换终极指南【免费下载链接】libredwg Official mirror of libredwg. With CI hooks and nightly releases. PRs ok 项目地址: https://gitcode.com/gh_mirrors/li/libredwg 还在为AutoCAD的DWG文件格式不兼容而烦恼吗&a…

2026/6/14 19:44:58 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/14 0:01:11 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

2026/6/14 0:01:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/14 10:35:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/14 10:02:42 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/14 10:02:42 阅读更多

相关文章

Wayback Machine浏览器扩展：让消失的网页永远触手可及的数字时光机

SAP FIORI实战：手把手教你用ICMR App搞定公司间对账（附操作截图）

Google 爬虫工作原理，及用Python实现完整的Google爬虫

如何在Kodi中实现115网盘原码播放：完整安装配置指南

GR3-Fourier V10.2主要内容包括：1）无传感器磁链观测器的C语言实现，含电阻/电感参数和滤波系数；2）三相电流克拉克变换的优化算法；3）动态内存池管理机制；4）电网锁相环幅值归一化处理。

MapLibre GL JS第49课：用表达式创建渐变线

自制串口和 VGA “万能控制台”：从旧设备改造到终端模拟器适配

5分钟搭建Windows AirPlay接收器：免费开源方案全解析

3分钟快速上手：LibreDWG免费DWG文件转换终极指南

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因