Supermemory 设计、品味与借鉴

发布时间：2026/6/28 17:30:42

Supermemory 设计、品味与借鉴调研对象https://github.com/supermemoryai/supermemory/tree/main核心判断Supermemory 开源仓库没有完整暴露记忆引擎的算法实现。它最值得学习的不是 embedding、抽取、冲突判断这些内部细节而是它把“长期记忆”设计成了一套可操作、可复现、可修正的产品协议。一句话记住长期记忆不是把内容存起来而是保证下一次相关场景里它会以正确形式重新出现。更好理解的方式记忆飞轮Supermemory 可以理解成一个“记忆飞轮”而不是一个向量库。输入内容 - 绑定边界 - 提炼成记忆 - 下一次自动注入 - 使用后继续沉淀 - 过期、更新、遗忘 - 用图谱解释来源这比普通 RAG 更深一层。RAG 解决的是“资料在哪里”。Memory 解决的是“什么应该在未来再次影响我”。它真正提供的操作1.remember不是保存文本而是保存未来上下文Supermemory 写入时不只是接收content还强调containerTag这条记忆属于谁、哪个项目、哪个 Agent。entityContext系统应该用什么语境理解这段内容。metadata来源、类型、补充信息。可借鉴点remember({content,containerTag,entityContext,metadata,});深层观点没有边界的记忆只是堆积有边界的记忆才会成为长期状态。2.profile比搜索更重要普通搜索返回片段profile返回“适合注入模型的上下文”。它通常包含稳定偏好。长期事实。近期变化。与当前问题相关的记忆。这是真正有产品感的地方。因为长期记忆不能依赖模型临时想起来要不要搜索而应该在回答前自动进入上下文。可借鉴接口profile(containerTag, query?) - prompt-ready context深层观点真正可靠的记忆不是“可被查到”而是“该出现时会出现”。3.inject把记忆变成默认前提Supermemory 的 SDK wrapper 会在模型调用前做三件事取 profile/search context - 注入 system prompt - 再调用模型这比提供一个searchMemorytool 更稳。Tool 需要模型主动调用注入则把关键记忆变成回答的默认前提。源码里现在的插入方式比较直接Vercel AI SDK wrapper如果已有 system prompt就把 memories 追加到 system 内容后面如果没有就新建一个 system message 放在最前面。OpenAI Chat wrapper同样追加到已有 system prompt或者创建新的 system message。OpenAI Responses wrapper把 memories 追加到instructions。Python / Agent Framework wrapper逻辑类似都是优先修改 system message。这说明 Supermemory 的产品判断是对的记忆应该在回答前出现而不是等模型主动调用工具。但工程上也有一个问题如果每一轮都把动态 memory 追加进 system promptsystem 前缀就会频繁变化可能降低 LLM 的 prefix cache 命中。更理想的插入协议应该是稳定 system 指令 - 稳定格式的 memory block - 当前问题相关的短记忆 - 用户问题关键不是“不要注入”而是“低扰动注入”稳定 system 指令放在最前面尽量不变。memory block 的标题、顺序、格式保持稳定。动态 search memory 尽量短只放和当前问题相关的内容。不要在 memory block 里加入时间戳、随机摘要、顺序不稳定的列表。如果模型或框架支持独立 context / tool result / cached prompt segment优先把动态记忆放到不会破坏稳定前缀的位置。深层观点长期记忆要成为思考环境而不是可选工具但好的思考环境应该稳定不能每轮都重写模型的前缀。4.saveConversation形成闭环模型回答后conversation 会被异步保存回记忆系统。历史记忆影响当前回答当前对话沉淀为未来记忆这就是记忆飞轮的闭环。这里的好设计是异步保存记忆服务失败时不阻塞主回答但仍尽量沉淀长期状态。5.update / forget防止记忆变脏长期记忆最大的问题不是记不住而是越记越脏。这里容易误解下面这些不是说每次recall都会完整返回这些字段。它们主要是底层MemoryEntry的状态字段表示 Supermemory 的记忆模型支持“版本链”和“关系图”。profile往往只返回可注入 prompt 的文本搜索结果可能带version和context.parents / context.children图谱和文档接口才更接近完整 memory 对象。Supermemory 的 schema 里保留了这些语义isLatestisForgottenforgetAfterparentMemoryIdrootMemoryIdmemoryRelations可以用一个例子理解m1: 用户正在做 React 项目 m2: 用户现在主要在做 Agent 记忆系统 m2.parentMemoryId m1 m2.rootMemoryId m1 m2.memoryRelations { m1: updates } m2.isLatest true m1.isLatest falseparentMemoryId表示“这条记忆直接接在哪条旧记忆后面”。它像链表里的上一环用来形成m1 - m2 - m3这样的版本链。rootMemoryId表示“这一整条版本链最早从哪条记忆开始”。不管当前是m2还是m3它都能指回最初的m1。memoryRelations表示“这条记忆和其他记忆是什么关系”。目前关系类型主要有updates新事实更新旧事实例如“用户以前做 React现在做 Agent 记忆系统”。extends新事实补充旧事实例如“用户做 Agent 记忆系统”之后补充“重点关注 prefix cache”。derives新事实从某段内容推导出来例如从会议记录推导出“用户重视长期记忆设计”。这说明它把记忆看成会变化、会互相修正的状态而不是静态文本。深层观点没有遗忘机制的长期记忆最后会变成长期污染。6.memory graph让记忆可解释图谱不是炫技而是信任机制。它让用户能看到这条记忆从哪里来。它更新了哪条旧记忆。它扩展了什么事实。它是否仍然有效。深层观点不能解释来源的记忆很难被长期信任。最值得学的设计锚点containerTagcontainerTag是 Supermemory 最关键的抽象。它同时是状态边界记忆属于哪个用户、项目或 Agent。权限边界谁能读写这批记忆。产品边界记忆如何被组织和复用。可以这样理解没有 containerTag记忆是一堆全局文本。有 containerTag记忆成为可控的长期状态。如果我们做自己的系统第一优先级不是先做复杂图谱而是先确定这个边界字段。代价与不足这些不足是借鉴时必须看清的边界。自动注入会放大脏记忆风险。profile / inject让记忆“该出现时出现”但旧事实、错误偏好、过度个性化也会更稳定地污染回答。containerTag是好边界也是高要求。边界划错记忆就会串场边界切太碎长期记忆又无法复用。图谱解释来源不等于证明正确。它能提升信任感但不能替代记忆质量评估。最缺的是评估闭环什么叫该出现时出现什么叫不该出现时不出现这比 embedding 命中率更难测。所以 Supermemory 值得学的是“长期记忆协议”不是直接相信它已经解决了长期记忆质量。最终借鉴Supermemory 的真正品味是它把 memory 从“检索能力”升级成“长期状态管理”。如果要借鉴只需要先抓住这条主线长期记忆边界语境自动再出现更新遗忘可解释这也是写文档、做产品、做 Agent 记忆都共通的原则深刻不是信息更多而是读者或系统在未来遇到相关场景时还能重新调出那个关键判断。参考源码https://github.com/supermemoryai/supermemory/blob/main/apps/mcp/src/server.tshttps://github.com/supermemoryai/supermemory/blob/main/packages/tools/src/shared/memory-client.tshttps://github.com/supermemoryai/supermemory/blob/main/packages/tools/src/vercel/memory-prompt.tshttps://github.com/supermemoryai/supermemory/blob/main/packages/tools/src/openai/middleware.tshttps://github.com/supermemoryai/supermemory/blob/main/packages/validation/schemas.tshttps://github.com/supermemoryai/supermemory/blob/main/packages/memory-graph/src/hooks/use-graph-data.ts

IntelliJ IDEA、PyCharm、WebStorm协同开发效率暴涨300%，JetBrains All Products Pack多IDE联动实战手册

更多请点击： https://kaifayun.com 第一章：JetBrains All Products Pack 的核心价值与协同开发范式演进 JetBrains All Products Pack（APP）并非简单的产品集合，而是面向现代软件工程全生命周期的一体化智能开发基础设…

2026/6/28 17:29:21 阅读更多

8个技巧掌握NSC_BUILDER：Switch游戏文件管理的全能解决方案

8个技巧掌握NSC_BUILDER：Switch游戏文件管理的全能解决方案【免费下载链接】NSC_BUILDER Nintendo Switch Cleaner and Builder. A batchfile, python and html script based in hacbuild and Nuts python libraries. Designed initially to erase titlerights enc…

2026/6/28 17:29:21 阅读更多

终极文档下载解决方案：如何免费下载百度文库等30+平台资料

终极文档下载解决方案：如何免费下载百度文库等30平台资料【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档，但是相关网站浏览体验不好各种广告，各种登录验证，需要很多步骤才能下载文档，该脚本就是为…

2026/6/28 17:29:21 阅读更多

零基础搭建电脑自动助手 OpenClaw 可视化部署手册（含安装包）

Windows 本地自动化 AI 搭建指南：OpenClaw 2.7.9 一键部署完整实操当下本地 AI 工具凭借数据自主管控、不受网络波动影响等优势，深受职场从业者与技术爱好者青睐。OpenClaw，圈内俗称小龙虾 AI 智能体，主打电脑自主操控能力&…

2026/6/28 18:44:00 阅读更多

瑞萨RX MCU lwIP FIT模块配置与调优实战指南

1. 项目概述在嵌入式开发领域，尤其是工业控制、楼宇自动化这类对实时性和可靠性要求极高的场景，为微控制器（MCU）赋予网络通信能力已经从一个“加分项”变成了“必选项”。然而，在资源受限的MCU上跑一个完整的TCP/IP协…

2026/6/28 18:43:19 阅读更多

蓝桥杯单片机实战：PWM调光与呼吸灯实现详解

1. PWM调光与呼吸灯的前世今生第一次接触PWM调光是在大二电子设计课上，当时老师让我们用单片机控制LED亮度。我傻乎乎地直接给LED接了个可变电阻，结果不仅亮度调节不线性，电阻还烫得能煎鸡蛋。直到学长演示了用PWM实现的呼吸灯效果&#xff…

2026/6/28 18:43:19 阅读更多

基于RX261与DA1453x的物联网设备FOTA（固件空中升级）实战指南

1. 项目概述与核心价值在物联网设备遍地开花的今天，如何高效、安全地管理成千上万台部署在户外的嵌入式设备，是每个产品经理和开发工程师都必须面对的挑战。想象一下，你的智能路灯、环境传感器或者可穿戴设备发现了一个安全漏洞，难…

2026/6/28 18:43:19 阅读更多

老旧安卓电视终极优化方案：MyTV-Android轻量直播应用完整指南

老旧安卓电视终极优化方案：MyTV-Android轻量直播应用完整指南【免费下载链接】mytv-android 使用Android原生开发的视频播放软件项目地址: https://gitcode.com/gh_mirrors/my/mytv-android 还在为家中老旧安卓电视的卡顿问题烦恼吗？想找到一款…

2026/6/28 18:42:59 阅读更多

腾讯TMagic Editor：可视化页面搭建如何让前端开发效率提升300%？

腾讯TMagic Editor：可视化页面搭建如何让前端开发效率提升300%？ 【免费下载链接】tmagic-editor 项目地址: https://gitcode.com/GitHub_Trending/tm/tmagic-editor 你是否曾经为开发一个简单的营销活动页面而花费数天时间？是否在重复…

2026/6/28 18:42:39 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/28 12:54:48 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/28 13:30:24 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/28 13:30:22 阅读更多

相关文章

IntelliJ IDEA、PyCharm、WebStorm协同开发效率暴涨300%，JetBrains All Products Pack多IDE联动实战手册

8个技巧掌握NSC_BUILDER：Switch游戏文件管理的全能解决方案

终极文档下载解决方案：如何免费下载百度文库等30+平台资料

零基础搭建电脑自动助手 OpenClaw 可视化部署手册（含安装包）

瑞萨RX MCU lwIP FIT模块配置与调优实战指南

蓝桥杯单片机实战：PWM调光与呼吸灯实现详解

基于RX261与DA1453x的物联网设备FOTA（固件空中升级）实战指南

老旧安卓电视终极优化方案：MyTV-Android轻量直播应用完整指南

腾讯TMagic Editor：可视化页面搭建如何让前端开发效率提升300%？

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因