Agent 记忆设计：长期记忆不是把聊天记录全塞回去

发布时间：2026/7/3 2:09:38

Agent 记忆设计长期记忆不是把聊天记录全塞回去一、记忆越多不代表 Agent 越聪明AI Agent 做久了很多人会自然想到“加长期记忆”。于是把用户历史对话、工具调用、偏好和任务结果全部存起来下次再塞回上下文。这样做成本高、噪声大也容易引入隐私风险。长期记忆不是聊天记录仓库而是经过筛选、压缩和权限控制的事实集合。好的记忆应该帮助 Agent 更稳定完成任务比如用户偏好、项目约束、常用路径、已验证结论和失败经验。临时闲聊、过期上下文和不确定猜测不应该长期保存。记忆需要治理不是越多越灵。二、记忆链路提取、验证、存储、召回flowchart TD A[会话内容] -- B[候选记忆提取] B -- C[重要性判断] C -- D[用户或规则确认] D -- E[记忆存储] E -- F[任务相关召回]候选记忆要分类型。偏好类例如“用户喜欢简洁回答”项目事实类例如“当前项目使用 Next.js”安全边界类例如“不要自动执行删除命令”经验类例如“某脚本在 macOS 下失败过”。不同类型的过期策略不同。召回也要按任务相关性。用户问一个算法问题不一定需要加载全部产品偏好。上下文窗口有限召回越精准Agent 越稳定。记忆系统不是为了显得懂用户而是为了减少重复沟通和错误动作。三、记忆结构保存事实和来源下面是一份简化记忆结构。{ id: mem_001, type: project_constraint, content: 项目使用 pnpm 和 Vite测试命令是 pnpm test, source: user_confirmed, created_at: 2026-07-02, expires_at: null }source很重要。用户明确确认的记忆比模型推断的记忆可靠。模型推断可以先作为候选不应该直接变成长期事实。否则 Agent 会把一次上下文误解长期保存后面不断放大错误。记忆还要支持删除和修改。用户应能查看 Agent 记住了什么并撤销不需要的内容。隐私和控制权是记忆系统的底线。四、评测方法看任务成功率和误召回记忆系统上线后不要只看召回命中率。更重要的是任务成功率是否提升、重复提问是否减少、误召回是否造成错误。比如 Agent 因为旧项目记忆在新项目里执行了错误命令这就是严重问题。可以构建记忆评测集给定任务和记忆库检查系统是否召回必要记忆、是否忽略无关记忆、是否在冲突时询问用户。记忆像数据库也需要测试查询质量。最后敏感记忆要加密或避免保存。API Key、私钥、身份证号、医疗信息等不应进入普通记忆库。Agent 越聪明越要懂得遗忘。记忆冲突也要处理。用户今天说项目用 Vite明天说已经迁移到 Next.js系统不能同时召回两个结论还装作没事。可以给记忆加状态旧记忆标记为 superseded新记忆成为 active。冲突时让 Agent 询问用户而不是自己选择一个看似合理的答案。还有一种常见问题是记忆过度个性化。Agent 因为历史偏好总是用固定风格回答反而忽略当前任务要求。记忆召回后仍要服从当前指令和安全边界长期偏好不能覆盖即时目标。记忆写入也要设置门槛。一次对话里出现的信息不一定值得长期保存。可以要求同一事实被多次使用、用户明确确认或者任务结果证明有价值后再写入。否则记忆库会像没有整理的阁楼什么都有但找不到真正重要的东西。五、总结Agent 长期记忆不是把聊天记录全塞回上下文而是提取经过验证、可管理、可撤销的任务事实。记忆要有类型、来源、过期和评测。会记也要会忘。

MetaTube插件：Jellyfin/Emby媒体库的终极元数据自动刮削解决方案

MetaTube插件：Jellyfin/Emby媒体库的终极元数据自动刮削解决方案【免费下载链接】jellyfin-plugin-metatube MetaTube Plugin for Jellyfin/Emby 项目地址: https://gitcode.com/gh_mirrors/je/jellyfin-plugin-metatube 你是否曾经为Jellyfin或Emby媒体库中…

2026/7/3 2:09:18 阅读更多

Rust FFI 包装推理库：unsafe 边界要像防火墙一样清楚

Rust FFI 包装推理库：unsafe 边界要像防火墙一样清楚很多高性能推理库是 C/C 写的，Rust 服务要复用它们，就绕不开 FFI。FFI 本身没问题，问题在于把 unsafe 扩散到业务代码里。指针生命周期、内存释放、线程安全、错误码转换&…

2026/7/3 2:08:57 阅读更多

跨境电商选灵爪AI开发需看真实案例与预算

跨境电商选灵爪AI开发需看真实案例与预算随着人工智能技术在商业领域的渗透，短视频平台及各类科技媒体上关于“AI智能体定制”的讨论日益增多。当用户关注抖音科技博主推荐的AI智能体定制服务值得了解吗这一话题时，核心考量点不应仅停留在推荐内容的热度…

2026/7/3 2:08:17 阅读更多

苹果 App Store 卡审核一天怎么办？别急着撤回，先看看是不是这几种情况

苹果 App Store 卡审核一天怎么办？别急着撤回，先看看是不是这几种情况不少开发者在提交 App Store 审核后，发现状态一直停留在**“等待审核（Waiting for Review）”或者“审核中（In Review）”*…

2026/7/3 3:20:50 阅读更多

药流后要做小月子吗？休养原则与科学营养修护科普

不少女性抱有认知误区，认为药流没有宫腔器械操作、创伤轻微，不需要坐小月子休养。但从临床妇科养护数据来看，药物依靠激素强制终止妊娠，身体会出现内分泌骤变、内膜脱落、气血损耗等多项变化，休养疏漏极易诱发恶露不尽…

2026/7/3 3:20:29 阅读更多

机器学习生产化实战：模型上线后的稳定性、可观测性与漂移治理

1. 项目概述：这不是“跑通模型”，而是让模型在真实世界里活下来“From Notebook to Production: Running ML in the Real World (Part 4)”——这个标题本身就像一句行话暗号，老手一眼就懂：前面三篇已经蹚过了数据清洗、特征工程、…

2026/7/3 3:20:09 阅读更多

为什么workbuddy连win+D显示桌面都做不到，Claude和Codex却可以？这里面是安全的取舍

现象我尝试了让workbuddy帮我把电脑设置为只显示桌面，把其他窗口都最小化。它试了N种方法都做不到；国内agent普遍不能真的操作电脑；但是国外的Claude和Codex都可以。真正的情况（WorkBuddy 的对话回复功能）没法直接控制…

2026/7/3 3:19:29 阅读更多

Hermes Agent 部署实战：从零到一构建可用的 AI 智能体

🚀 30款热门AI模型一站整合，DeepSeek/GLM/Claude 随心用，限时 5 折。 👉 点击领海量免费额度如果你最近在关注 AI Agent 领域，或者尝试过一些开源项目，大概率会遇到这样的困境： 教程要么过…

2026/7/3 3:18:07 阅读更多

浏览器端音乐解锁技术深度解析：Unlock Music项目实战指南

浏览器端音乐解锁技术深度解析：Unlock Music项目实战指南【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: ht…

2026/7/3 3:17:07 阅读更多

GPT-5与Veo3双引擎AI开发实战与避坑指南

1. 项目概述：下一代AI开发范式革新2026年的全栈开发正在经历一场静默革命。当GPT-5.2-Pro遇上Veo3，开发者终于可以摆脱繁琐的API对接噩梦。上周我用这个方案重构了公司的智能客服系统，原本需要3天完成的跨平台对接，现在只需在终端…

2026/7/3 0:00:48 阅读更多

AutoRaise终极指南：3分钟掌握macOS鼠标悬停自动激活窗口技巧

AutoRaise终极指南：3分钟掌握macOS鼠标悬停自动激活窗口技巧【免费下载链接】AutoRaise AutoRaise (and focus) a window when hovering over it with the mouse 项目地址: https://gitcode.com/gh_mirrors/au/AutoRaise AutoRaise是一款革命性的macOS窗口管…

2026/7/3 0:00:48 阅读更多

STM32G071RB与WSEN-ISDS IMU运动跟踪开发指南

1. 项目背景与硬件选型解析在嵌入式系统开发中，精确跟踪物体在三维空间中的运动和姿态是一个常见但极具挑战性的需求。WSEN-ISDS（型号2536030320001）是Wrth Elektronik推出的一款高性能6轴MEMS惯性测量单元(IMU)，结合STM32G071RB微…

2026/7/3 0:01:09 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/3 0:18:29 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/7/3 2:01:12 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/7/3 2:01:03 阅读更多

FAE放射组学分析工具：医学影像特征探索的完整解决方案

FAE放射组学分析工具：医学影像特征探索的完整解决方案【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手？想要从CT、MRI等影像中提取有价值的定量特征&#…

2026/7/3 0:03:16 阅读更多

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南

0.69B参数实现中文多模态AI：揭秘Qwen3-SmVL模型融合技术的完整实战指南【免费下载链接】happy-llm 📚 从零开始构建大模型项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…

2026/7/3 0:18:23 阅读更多

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南

解锁AMD Ryzen处理器性能潜力的SMU调试神器：从新手到专家的完整指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…

2026/7/3 0:18:26 阅读更多

相关文章