模型没失忆，是你没给它记忆——速通 LangChain Memory最短路径

发布时间：2026/6/15 5:11:07

DeepSeek 官网能记住我叫大煊、刚才聊啥同样的问题搬到本地invoke调模型第二轮它直接回「我不知道你刚才提到的名字」。模型没坏是我没给记忆。对 Javaer 来说LangChain 的 Memory记忆就像HttpSession 里塞对话记录或者 ThreadLocal 里挂的上下文——不是大模型自带记忆是你在每次请求前后维护一份「聊天记录副本」再塞给模型看。我从对照实验到RunnableWithMessageHistory带历史消息的可运行链跑通的最短路径内存版 → 多 session 隔离 → 可选 Redis 落盘。真相失忆发生在应用层不在模型里模型本身不会自动记住上一轮。是应用层在读历史、写历史、拼 Prompt提示词。实现记忆就三件事读从记忆组件取出历史对话拼历史当前用户输入塞进 Prompt传给模型写本轮问答写回记忆组件可以记一句Memory 不是让模型变聪明是让每次请求变「完整」。用户输入Prompt: history questionMemoryModel回答RunnableWithMessageHistoryLangChain 早期有个ConversationChain几行代码就能聊但提示模板和内存逻辑绑死跟 LCEL 链式调用的Runnable体系不太合拍。LangChain 0.3.x 起推荐RunnableWithMessageHistory你的链还是prompt | llm | parser外面套一层壳通过get_session_history回调决定历史存哪儿。跟 Spring 从「一个大而全的 Facade」往「小接口组合」演进的路数有点像——换存储后端不用动链本身。自己往history.messages里塞消息再llm.invoke也能拼但 Runnable替你自动化了读 → 拼 → 写那一圈。存储后端怎么选实现特性InMemoryChatMessageHistory内存进程退出即丢FileChatMessageHistory文件单机持久化RedisChatMessageHistoryRedis多实例共享、可持久化ElasticsearchChatMessageHistoryES适合检索型场景BaseChatMessageHistory是用来保存聊天消息历史的抽象基类,其中最重要就是清空所有消息和添加消息点开抽象基类可以看到Langchain可选的记忆存储组件还是有很多选型对照实验没 Memory 的「我不知道」跑下面这段两轮invoke彼此独立——上一轮的内容根本没传进去importosfromdotenvimportload_dotenvfromlangchain_core.output_parsersimportStrOutputParserfromlangchain_core.promptsimportPromptTemplatefromlangchain.chat_modelsimportinit_chat_model load_dotenv()llminit_chat_model(modelos.getenv(DEEPSEEK_MODEL,deepseek-chat),model_provideropenai,api_keyos.getenv(DEEPSEEK_API_KEY),temperature0.0,base_urlos.getenv(DEEPSEEK_BASE_URL,https://api.deepseek.com),)promptPromptTemplate.from_template(请根据用户问题作答{question})chainprompt|llm|StrOutputParser()print(chain.invoke({question:你好我是大煊你怎么称呼}))print(chain.invoke({question:你还记得我刚才自我介绍的名字吗}))自动挡多 session RunnableWithMessageHistory真实项目里不同用户得隔离历史。用一个dict按session_id会话标识存各自的InMemoryChatMessageHistory——跟 Java 里MapString, HttpSession按 userId 取 Session 是一个路数。importosfromdotenvimportload_dotenvfromlangchain.chat_modelsimportinit_chat_modelfromlangchain_core.chat_historyimportInMemoryChatMessageHistoryfromlangchain_core.runnables.historyimportRunnableWithMessageHistoryfromlangchain_core.promptsimportChatPromptTemplate,MessagesPlaceholderfromlangchain_core.output_parsersimportStrOutputParser load_dotenv()llminit_chat_model(modelos.getenv(DEEPSEEK_MODEL,deepseek-chat),model_provideropenai,api_keyos.getenv(DEEPSEEK_API_KEY),base_urlos.getenv(DEEPSEEK_BASE_URL,https://api.deepseek.com),)store{}defget_session_history(session_id:str):ifsession_idnotinstore:store[session_id]InMemoryChatMessageHistory()returnstore[session_id]promptChatPromptTemplate.from_messages([(system,你是一个耐心的中文助理会结合上文连贯作答。),MessagesPlaceholder(history),(human,{question}),])memory_chainprompt|llm|StrOutputParser()with_historyRunnableWithMessageHistory(memory_chain,get_session_history,input_messages_keyquestion,history_messages_keyhistory,)cfg{configurable:{session_id:user-001}}print(AI,with_history.invoke({question:我是大煊Javaer 一枚。},cfg))print(AI,with_history.invoke({question:你记得我叫啥不},cfg))三个名字必须对齐模板里MessagesPlaceholder(history)、history_messages_keyhistory、input_messages_keyquestion与 Prompt 里 human 的{question}一致——我对过一次少一个历史就是空的模型每轮都像第一次见面。可选进阶Redis Stack内存版进程一挂历史就没了。要上生产或本地重启还想接着聊把get_session_history里的实现换成RedisChatMessageHistory就行——链和 Prompt 不用动只改回调。开发阶段注意REDIS_URL端口和 reids端口映射对齐有ttl的话历史可能被自动清掉。Redis Stack是redis的扩展版也是近年来redis的主推版本功能维度原生 RedisRedis Stack 增强功能数据结构字符串、列表、集合、哈希等增加 JSON、图、时间序列、概率结构等高级类型查询能力仅限键值查询支持全文搜索、向量搜索、图查询、JSON 查询使用场景缓存、消息队列、计数器等实时推荐、时序分析、知识图谱、文档数据库、AI 向量检索开发体验命令行操作需手动拼装逻辑提供 RedisInsight 和对象映射库开发效率更高复杂多 Agent 编排以后可以换 LangGraph 的 Checkpointer这是「AI Agent 实战踩坑」系列的第 5 篇。欢迎大家关注后续还会继续分享知识片段参考LangChain Short-term memory

嵌入式系统高可靠性设计：看门狗与CRC校验原理与实战配置

1. 项目概述在嵌入式系统开发，尤其是汽车电子、工业控制这类对可靠性要求极高的领域，系统稳定运行是底线。我们写的代码再严谨，也难免会遇到外部电磁干扰、电源波动，或者某些极端条件下软件逻辑陷入死循环的情况。一旦程序“跑飞”…

2026/6/14 18:24:46 阅读更多

番茄阅文百度都入场了——AI写作工具的选择变多了，但核心问题变了

最近网文圈最值得关注的一件事可能跟你手里的稿子没有直接关系——但它跟你未来用什么东西写稿子有非常大的关系。番茄、阅文、百度这些大平台，正在把自己的AI写作工具内建到各自的生态里面去。不声不响，不需要融资，不需要在市场上跟谁抢用户…

2026/6/15 0:30:42 阅读更多

别再只盯着h=1了！用Matlab的adftest做ADF检验，这3个输出参数你得会看

超越h1：Matlab中ADF检验输出参数的深度解读与应用策略在时间序列分析领域，ADF检验（Augmented Dickey-Fuller test）是判断数据平稳性的黄金标准之一。许多Matlab用户在使用adftest函数时，往往只关注返回的h值——这个简…

2026/6/15 0:59:06 阅读更多

原神自动化脚本：三分钟掌握安全高效的图像识别辅助方案

原神自动化脚本：三分钟掌握安全高效的图像识别辅助方案【免费下载链接】genshin-impact-script 原神脚本，包含自动钓鱼、自动拾取、自动跳过对话等多项实用功能。A Genshin Impact script includes many useful features such as automatic fishing, au…

2026/6/15 17:51:00 阅读更多

基于事件驱动的游戏自动化框架：罗技鼠标宏技术深度解析

基于事件驱动的游戏自动化框架：罗技鼠标宏技术深度解析【免费下载链接】logitech-pubg PUBG no recoil script for Logitech gaming mouse / 绝地求生罗技鼠标宏项目地址: https://gitcode.com/gh_mirrors/lo/logitech-pubg 在游戏自动化领域&#xff0c…

2026/6/15 17:49:59 阅读更多

大学生创业课期末复习自救指南：手把手教你整理超星学习通《创业基础》核心考点（附章节测试思路）

大学生创业课期末复习自救指南：手把手教你整理超星学习通《创业基础》核心考点又到了期末复习的紧张时刻，选修王艳茹老师《创业基础》的同学们是否正对着厚厚的教材和零散的章节测试题发愁？别担心，这份复习指南将带你用最短的时间…

2026/6/15 17:48:57 阅读更多

从VAX到云服务：手把手梳理MicroStation 35年版本迭代史（含关键功能解读）

从VAX到云服务：MicroStation 35年技术演进与设计革命1985年，当Bentley Systems推出PseudoStation时，很少有人能预见这款运行在VAX系统上的软件会成为未来CAD行业的基石。35年间，MicroStation从简单的图形查看工具演变为支持云协作…

2026/6/15 17:47:56 阅读更多

GDSDecomp深度解析：Godot逆向工程的技术架构与实战应用

GDSDecomp深度解析：Godot逆向工程的技术架构与实战应用【免费下载链接】gdsdecomp Godot reverse engineering tools 项目地址: https://gitcode.com/GitHub_Trending/gd/gdsdecomp 在游戏开发的生命周期中，Godot引擎的PCK资源包管理一直是技术团…

2026/6/15 17:47:14 阅读更多

AI聊天隐私风险与三道物理隔离防护墙

1. 项目概述：当AI聊天窗口变成“透明玻璃房”——我们到底在和谁对话？你有没有过这样的时刻：深夜加班改方案，把客户名称、合同金额、甚至自己刚收到的银行流水截图，一股脑粘贴进ChatGPT的对话框里，只为了让…

2026/6/15 17:46:53 阅读更多

终极便携开发套件：5分钟快速上手w64devkit Windows开发环境

终极便携开发套件：5分钟快速上手w64devkit Windows开发环境【免费下载链接】w64devkit Portable C and C Development Kit for x64 (and x86) Windows 项目地址: https://gitcode.com/gh_mirrors/w6/w64devkit 你是否厌倦了在Windows上配置复杂的C/C开发环境…

2026/6/15 0:00:36 阅读更多

深蓝词库转换：打破20+输入法壁垒的技术架构深度解析

深蓝词库转换：打破20输入法壁垒的技术架构深度解析【免费下载链接】imewlconverter ”深蓝词库转换“ 一款开源免费的输入法词库转换程序项目地址: https://gitcode.com/gh_mirrors/im/imewlconverter 当你在不同平台间切换输入法时，是否曾为无…

2026/6/15 0:02:18 阅读更多

NSK紧凑型精密滚珠丝杠技术手册

型号 W1202FA-3P-C3Z5 属于 the sources 中 NSK 推出的紧凑型 FA 系列（Compact FA Series）高速精密滚珠丝杠。如果您一路追踪了之前的查询记录，这款产品正是您不久前查询的 125 规格（12 mm 粗轴、5 mm 导程、预紧无背隙版&#x…

2026/6/15 0:02:59 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/15 0:09:30 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/15 0:09:27 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/15 0:09:27 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/15 10:37:31 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/15 10:16:08 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/15 10:16:07 阅读更多

相关文章