多轮上下文记忆

发布时间：2026/6/28 2:42:43

大模型本身是无状态的每次调用都是独立的。所谓的“记忆”本质上是工程侧对输入上下文的动态管理策略。核心目标是在成本、延迟、记忆长度三者之间取得平衡。我通过长期摘要短期滑动窗口实现记忆。前端LocalStorage只存展示数据传给LLM的是‘增量摘要最近5轮原文’。摘要异步生成避免阻塞关键实体单独抽取防止信息丢失。同时支持云端持久化实现跨会话记忆。这个方案在成本和效果之间取得了平衡已在项目中稳定运行。一、完整标准流程拆解分两层各司其职持久展示层LocalStorage 存全部原始完整对话作用是给用户看这里不做任何压缩、删减原样存储用户提问模型完整回复页面刷新、关闭重开完整聊天记录不丢失侧边历史记录、历史对话列表展示完整问答原文永久保存全量对话不会丢失早期聊天细节。LLM 推理层传给 LLM采用增量摘要滑动窗口双轨制——①最近对话原文按 Token 数量动态截断而非硬编码轮数每次从最新消息开始往前累加 Token直到达到上限如 4000 tokens保证绝不超出模型上下文窗口同时保留最近的交互细节保证上下文连贯【原想法是截取最近 5~8 轮完整对话---------但是如果一轮对话就有2000字8轮直接撑爆窗口了】② 早期历史摘要采用增量摘要每次只把旧摘要本轮新增的 N 轮对话压缩成新摘要确保摘要生成的 Token 消耗恒定为 O(1)不随对话总长度线性增长③ 强制抽取关键实体时间、人名、ID、数字、核心决策随摘要一起结构化保存防止纯文本摘要丢失关键细节④ 最终拼接「历史摘要关键实体清单最近动态截断的原文当前用户新问题」作为 Prompt 输入大模型。【为什么把’当前用户新问题’放在最后--------因为大多数LLM对输入末尾的注意力权重更高把当前问题放最后能让模型更聚焦于用户当下的诉求。】二、这么拆分的两大核心好处兼顾用户体验与接口成本用户侧能随时翻阅全部完整聊天记录不会丢失任何原文服务侧传给大模型的文本大幅缩短Token 消耗显著降低不会超出模型上下文窗口推理速度更快、幻觉更少。解耦不冲突本地存储的完整数据和发给模型的精简上下文是两套独立数据互不干扰本地永远有完整版兜底推理只使用轻量化压缩版。

Python算法实现｜YOLO检测/CV视觉项目交流｜故障诊断｜论文代码复现

大家好，这里是 LINK算法工坊。我主要提供 Python 算法实现、CV视觉项目、YOLO目标检测、论文代码复现、故障诊断与寿命预测、3D视觉、数据处理与部署调试等方向的项目咨询与技术支持。如果你有代码跑不通、环境配置失败、模型训练报错、论文不会复现、数据不知道怎么…

2026/6/28 2:42:23 阅读更多

办公室装修从设计到施工有哪些流程？老板提前看少走弯路

很多老板第一次装修办公室时，以为流程很简单：先出效果图，再谈报价，最后施工。真到项目开始后才发现，办公室装修不是这么回事。写字楼要物业报备，现场有消防和空调限制，水电要根据工位来排&#…

2026/6/28 2:42:03 阅读更多

seatunnel-web部署

部署方式来源seatunnel-web的github，亲测可行。网上有很多的seatunnel-web的部署方式，同时也有一些文章说此路不通，经过我多次测试以及不同的方法，当前方法亲测可行。核心要点：确保 SeaTunnel Web 与对应的 SeaTunne…

2026/6/28 2:42:03 阅读更多

高仕星维生素B | 长期染发后，毛囊最需要的不是“染“，而是“养“

染发是遮盖白发的直接手段，但长期染发的人容易陷入一个循环：染发→头发变差→白发更多→染得更频繁→发质更差。这不是一个可持续的方案。染发剂对头发和头皮的实际影响永久性染发剂的工作原理是：用碱性物质打开毛鳞片，让染料前体…

2026/6/28 4:10:09 阅读更多

熬夜压力大白发越来越多？科学解析与营养干预指南

熬夜压力大白发越来越多？这是很多当代成年人都会遇到的头发问题，从临床营养角度来看，这种现象确实和长期的不良生活状态直接相关，大多是毛囊核心营养缺口导致黑色素合成不足引发的，通过科学的营养补充可以有效干预改善…

2026/6/28 4:07:07 阅读更多

wps word运行2-3h时间后，突然变得很卡顿，这是什么原因？重新关闭后打开也不行？重启电脑能解决问题吗？这个是不是软件的bug？——不光word卡，电脑也有些卡顿，是不是夏天发热的原因？不光人要

wps word运行2-3h时间后，突然变得很卡顿，这是什么原因？重新关闭后打开也不行？重启电脑能解决问题吗？这个是不是软件的bug？——不光word卡，电脑也有些卡顿，是不是夏天发热的原因&…

2026/6/28 4:06:47 阅读更多

今天GESP考试结束，我没有和孩子聊分数，而是聊了这5件事

今天，CCF-GESP第14次认证考试结束了。考试结束后，我收到了很多家长和学生发来的消息。有同学开心地说："老师，我都会，提前交卷了！"也有同学失落地说："老师，我有道大题…

2026/6/28 4:06:27 阅读更多

2026.6.27：C++11 random随机性测试

C++11 random随机性测试 #include <iostream> #include <random> #include <cstring>

2026/6/28 4:06:27 阅读更多

推荐题目：洛谷 P1044 [NOIP 2003 普及组] 栈

推荐题目：洛谷 P1044 [NOIP 2003 普及组] 栈在洛谷，可提交！ 洛谷背景换了~ 题目背景栈是计算机中经典的数据结构，简单的说，栈就是限制在一端进行插入删除操作的线性表。栈有两种最重要的操作，即 pop&…

2026/6/28 4:06:07 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/27 12:47:04 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/27 13:25:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/27 13:25:16 阅读更多

相关文章

Python算法实现｜YOLO检测/CV视觉项目交流｜故障诊断｜论文代码复现

办公室装修从设计到施工有哪些流程？老板提前看少走弯路

seatunnel-web部署

高仕星维生素B | 长期染发后，毛囊最需要的不是“染“，而是“养“

熬夜压力大白发越来越多？科学解析与营养干预指南

wps word运行2-3h时间后，突然变得很卡顿，这是什么原因？重新关闭后打开也不行？重启电脑能解决问题吗？这个是不是软件的bug？——不光word卡，电脑也有些卡顿，是不是夏天发热的原因？不光人要

今天GESP考试结束，我没有和孩子聊分数，而是聊了这5件事

2026.6.27：C++11 random随机性测试

推荐题目：洛谷 P1044 [NOIP 2003 普及组] 栈

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因