腾讯开源了一个项目两个月拿了 4600 Star。做的事非常专一给 AI Agent 装上长期和短期记忆。装完之后什么效果评测数据摆在这针对长期记忆整体准确率从 47.85% 涨到 76.10%提升将近 60%。用户事实召回从不到 30% 飙到 79%。基于短期记忆的加持长任务中最高节省 61% token。这个项目叫 TencentDB Agent Memory腾讯云数据库团队做的5 月 14 日正式开源的。来看看在 OpenClaw 和 Hermes 中的效果。01AI 记忆到底难在哪现在点击开一个 Agent 的新会话其实都会默认认为它啥都不知道。你得把相关的上下文或者信息给它说一遍它才能干好活。Memory 的目的还是提高我们的效率。TencentDB Agent Memory 的思路和主流的方案不太一样。它的思路是符号化短期记忆 分层长期记忆。开源地址https://github.com/TencentCloud/TencentDB-Agent-Memory现在主流的解决方案大概有三种但都有明显短板。第一种全塞进上下文窗口。简单粗暴但窗口有上限塞多了 token 直接爆掉。第二种用向量数据库做记忆。比全塞上下文好一些但问题是只存不提炼很多对话碎片时召回率低精确度差。第三种让大模型自己做摘要压缩。但压缩是不可逆的可能会造成关键细节丢失的问题。02腾讯开源项目的核心架构这个项目最核心的设计是一个四层渐进式记忆架构。L0 到 L3从底到顶每一层干的事不一样。L0原始对话。全量保留一字不落。兜底用随时可回查。L1原子事实。自动从对话里提取独立的事实节点比如我爱吃火锅、“我后用 NextJS”打标签存起来。L2场景聚类。相关的原子事实按场景聚合。比如用户系统讨论涉及的所有事实表结构、权限、接口合成一个场景块Markdown 格式人可直接读。L3用户画像。基于下面三层生成稳定的用户画像沉淀技术偏好、代码风格、常用工具链。这样既不会因为上下文太长影响推理也不会丢失关键信息。而且系统保证从顶层到原始证据有完整的回溯路径。L3 里说用户偏好 TypeScript这个结论可以追溯到 L2 某个场景块场景块里的每条结论又能追溯到 L1 的原子事实原子事实最终指向 L0 里你说过的那句话。整条证据链不断裂。03短期记忆压缩巧用 Mermaid 图四层架构解决长期记忆但短期上下文也是烧钱大户。AI 排查一个 bug 要调用十几次工具上下文塞满日志。解法是符号化记忆把完整日志卸载到外部文件用 Mermaid 语法画一张紧凑的任务状态图塞进上下文需要细节时再通过节点 ID 检索。Mermaid 用极少的 token 把线性摘要列表重组为带状态、依赖关系和可寻址索引的任务拓扑结构图。让 AI 大模型不靠记住什么标签而是靠从图的拓扑中推理出什么结构来理解任务全貌。信息密度更高、结构不丢失、细节可逐层找回。实测 Token 消耗直降超 50%任务完成率反升 23%。省了钱活还干得更好。语义检索Embedding擅长模糊匹配关键词检索BM25擅长精确命中。两路各自召回候选结果RRF 融合排序。语义相关的不会漏精确匹配的也不会丢04跑出来的数据说了这么多设计来看实际跑出来的数据。腾讯用 PersonaMem 基准测试做了评测对比的是原生 OpenClaw 和接入 Agent Memory 之后的 OpenClaw指标原生 OpenClaw接入 Agent Memory总准确率47.85%76.10%59%用户事实召回29.63%79.07%167%偏好跟踪66.67%83.45%25%个性化推荐46.67%76.36%64%用户事实召回这个指标最夸张从不到 30% 涨到 79%。意思是以前你跟 AI 说过的十件事它只能想起三件。现在能想起八件。除了 PersonaMem项目还跑了几个编程相关的基准测试WideSearch 成功率 33%→50%token 砍 61%SWE-bench 通过率 58.4%→64.2%token 省 33%。WideSearchp 评估信息任务中的搜索、整合与验证能力SWE-bench 是一个用于评估人工智能模型解决真实世界软件工程问题能力的评测基准加了记忆不光记住了更多做任务效率也变高了省下的 token 都用在干正事上。05怎么用这个项目现在是作为 OpenClaw 的插件发布的安装非常简单。一行命令搞定openclaw plugins install tencentdb-agent-memory/memory-tencentdb装完之后默认使用本地 SQLite sqlite-vec 作为存储后端零配置开箱即用。不需要你单独装数据库不需要连外部服务数据全在本地。如果你想接外部 Embedding 服务来增强语义检索效果可以在配置文件里指定。如果你用的是 Hermes Agent 框架项目也提供了 Docker 一体化镜像。把 Hermes Agent Memory 插件 Gateway 全打包在一个容器里docker pull 下来就能跑。支持的模型也很灵活。新的 1.0.0-beta.1 版本给希望自己开发 Agent Memory 适配层的用户提供了快速开始的方法。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
腾讯开源了 Agent Memory,让 AI 真正记住你。
发布时间:2026/6/7 2:05:11
腾讯开源了一个项目两个月拿了 4600 Star。做的事非常专一给 AI Agent 装上长期和短期记忆。装完之后什么效果评测数据摆在这针对长期记忆整体准确率从 47.85% 涨到 76.10%提升将近 60%。用户事实召回从不到 30% 飙到 79%。基于短期记忆的加持长任务中最高节省 61% token。这个项目叫 TencentDB Agent Memory腾讯云数据库团队做的5 月 14 日正式开源的。来看看在 OpenClaw 和 Hermes 中的效果。01AI 记忆到底难在哪现在点击开一个 Agent 的新会话其实都会默认认为它啥都不知道。你得把相关的上下文或者信息给它说一遍它才能干好活。Memory 的目的还是提高我们的效率。TencentDB Agent Memory 的思路和主流的方案不太一样。它的思路是符号化短期记忆 分层长期记忆。开源地址https://github.com/TencentCloud/TencentDB-Agent-Memory现在主流的解决方案大概有三种但都有明显短板。第一种全塞进上下文窗口。简单粗暴但窗口有上限塞多了 token 直接爆掉。第二种用向量数据库做记忆。比全塞上下文好一些但问题是只存不提炼很多对话碎片时召回率低精确度差。第三种让大模型自己做摘要压缩。但压缩是不可逆的可能会造成关键细节丢失的问题。02腾讯开源项目的核心架构这个项目最核心的设计是一个四层渐进式记忆架构。L0 到 L3从底到顶每一层干的事不一样。L0原始对话。全量保留一字不落。兜底用随时可回查。L1原子事实。自动从对话里提取独立的事实节点比如我爱吃火锅、“我后用 NextJS”打标签存起来。L2场景聚类。相关的原子事实按场景聚合。比如用户系统讨论涉及的所有事实表结构、权限、接口合成一个场景块Markdown 格式人可直接读。L3用户画像。基于下面三层生成稳定的用户画像沉淀技术偏好、代码风格、常用工具链。这样既不会因为上下文太长影响推理也不会丢失关键信息。而且系统保证从顶层到原始证据有完整的回溯路径。L3 里说用户偏好 TypeScript这个结论可以追溯到 L2 某个场景块场景块里的每条结论又能追溯到 L1 的原子事实原子事实最终指向 L0 里你说过的那句话。整条证据链不断裂。03短期记忆压缩巧用 Mermaid 图四层架构解决长期记忆但短期上下文也是烧钱大户。AI 排查一个 bug 要调用十几次工具上下文塞满日志。解法是符号化记忆把完整日志卸载到外部文件用 Mermaid 语法画一张紧凑的任务状态图塞进上下文需要细节时再通过节点 ID 检索。Mermaid 用极少的 token 把线性摘要列表重组为带状态、依赖关系和可寻址索引的任务拓扑结构图。让 AI 大模型不靠记住什么标签而是靠从图的拓扑中推理出什么结构来理解任务全貌。信息密度更高、结构不丢失、细节可逐层找回。实测 Token 消耗直降超 50%任务完成率反升 23%。省了钱活还干得更好。语义检索Embedding擅长模糊匹配关键词检索BM25擅长精确命中。两路各自召回候选结果RRF 融合排序。语义相关的不会漏精确匹配的也不会丢04跑出来的数据说了这么多设计来看实际跑出来的数据。腾讯用 PersonaMem 基准测试做了评测对比的是原生 OpenClaw 和接入 Agent Memory 之后的 OpenClaw指标原生 OpenClaw接入 Agent Memory总准确率47.85%76.10%59%用户事实召回29.63%79.07%167%偏好跟踪66.67%83.45%25%个性化推荐46.67%76.36%64%用户事实召回这个指标最夸张从不到 30% 涨到 79%。意思是以前你跟 AI 说过的十件事它只能想起三件。现在能想起八件。除了 PersonaMem项目还跑了几个编程相关的基准测试WideSearch 成功率 33%→50%token 砍 61%SWE-bench 通过率 58.4%→64.2%token 省 33%。WideSearchp 评估信息任务中的搜索、整合与验证能力SWE-bench 是一个用于评估人工智能模型解决真实世界软件工程问题能力的评测基准加了记忆不光记住了更多做任务效率也变高了省下的 token 都用在干正事上。05怎么用这个项目现在是作为 OpenClaw 的插件发布的安装非常简单。一行命令搞定openclaw plugins install tencentdb-agent-memory/memory-tencentdb装完之后默认使用本地 SQLite sqlite-vec 作为存储后端零配置开箱即用。不需要你单独装数据库不需要连外部服务数据全在本地。如果你想接外部 Embedding 服务来增强语义检索效果可以在配置文件里指定。如果你用的是 Hermes Agent 框架项目也提供了 Docker 一体化镜像。把 Hermes Agent Memory 插件 Gateway 全打包在一个容器里docker pull 下来就能跑。支持的模型也很灵活。新的 1.0.0-beta.1 版本给希望自己开发 Agent Memory 适配层的用户提供了快速开始的方法。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】