AI 的持续学习：从会话中提取可复用知识

发布时间：2026/5/22 3:44:34

作者注本文基于 ECC 项目的持续学习系统展示如何让 AI 编码助手从每次会话中自动积累和进化。项目开源地址github.com/affaan-m/ECC摘要最浪费资源的事情是让 AI 反复学习同一个教训。ECCEverything Claude Code项目的持续学习系统通过 Stop Hook 自动提取会话中的有效模式将其沉淀为可复用的 Skills。本文系统介绍持续学习的工作流、模式提取算法、置信度评分机制以及如何将个人调试技巧转化为团队知识资产。文章包含 Python 实现的模式提取器和 Skill 生成器代码。关键词持续学习、知识提取、模式识别、Skill 进化、Stop Hook一、问题的本质AI 在重复学习1.1 资源浪费的量化假设团队每天与 AI 进行 20 次会话每次会话中 AI 重新发现一个已知的调试技巧每日浪费估算 ├── 会话数: 20 次 ├── 每会话重复知识: 2-3 个 ├── 每个知识重新解释: 50-100 tokens ├── 每日浪费 Token: ~4,000 ├── 每月浪费 Token: ~120,000 └── 年化浪费: 大量时间和成本1.2 人类 vs AI 的学习差异维度人类开发者AI 助手记忆存储大脑笔记仅当前上下文跨会话记忆自然延续完全重置知识分享文档、口传无法自动分享模式识别需要刻意总结可以自动化持续学习的目标让 AI 具备跨会话积累知识的能力。二、ECC 持续学习工作流2.1 整体流程是否是否开发会话发现有效模式?记录到会话日志继续工作Stop Hook 触发提取可复用模式置信度阈值?创建/更新 Skill存入候选池skills/new-pattern/SKILL.md待观察池多次验证后提升图 1持续学习工作流 —— 从会话发现到 Skill 沉淀的完整链路2.2 为什么用 Stop HookECC 明确选择Stop Hook而非UserPromptSubmit维度UserPromptSubmitStop Hook触发频率每次用户消息会话结束一次对体验的影响增加每次响应延迟无感知信息完整性片段化完整的会话上下文处理复杂度需实时处理可批量处理三、模式提取算法3.1 什么是可复用模式可复用模式包括但不限于调试技巧“遇到 X 错误时检查 Y 配置”代码模式“在 Python 中处理 Z 场景的标准写法”架构决策“本项目选择 A 方案而非 B 方案的原因”工具使用“使用 C 工具的特定参数组合”3.2 Python 模式提取器#!/usr/bin/env python3 模式提取器 —— 从会话日志中提取可复用知识功能 1. 解析会话日志 2. 识别有效/无效方法 3. 计算模式置信度 4. 生成 Skill 草稿 importrefromtypingimportList,Dict,OptionalfromdataclassesimportdataclassfrompathlibimportPathdataclassclassPattern:提取的模式category:str# debug, coding, architecture, tooldescription:strevidence:str# 支持证据confidence:float# 0-1occurrences:int# 出现次数classPatternExtractor: 模式提取器从会话文本中提取可复用的知识模式 # 模式识别关键词PATTERN_MARKERS{debug:[解决,修复,debug,排查,原因,由于],coding:[模式,写法,实现,函数,类,推荐],architecture:[架构,设计,决策,选择,方案,对比],tool:[工具,命令,参数,配置,使用,运行],}# 有效性标记EFFECTIVE_MARKERS[成功,有效,解决,通过,worked,fixed]INEFFECTIVE_MARKERS[失败,无效,不行,错误,failed,error]def__init__(self,confidence_threshold:float0.7):self.confidence_thresholdconfidence_thresholddefextract(self,session_text:str)-List[Pattern]: 从会话文本提取模式 Args: session_text: 完整的会话文本 Returns: 提取的模式列表 patterns[]linessession_text.split(\n)# 提取调试模式debug_patternsself._extract_debug_patterns(lines)patterns.extend(debug_patterns)# 提取代码模式code_patternsself._extract_code_patterns(lines)patterns.extend(code_patterns)# 提取架构决策arch_patternsself._extract_architecture_patterns(lines)patterns.extend(arch_patterns)# 过滤低置信度return[pforpinpatternsifp.confidenceself.confidence_threshold]def_extract_debug_patterns(self,lines:List[str])-List[Pattern]:提取调试模式patterns[]fori,lineinenumerate(lines):ifany(kwinlineforkwin[解决,修复,fixed]):# 向前查找问题描述contextself._get_context(lines,i,3)# 判断是否有效is_effectiveany(kwincontextforkwinself.EFFECTIVE_MARKERS)ifis_effective:patterns.append(Pattern(categorydebug,descriptionself._summarize_debug(context),evidencecontext[:200],confidence0.8,occurrences1))returnpatternsdef_extract_code_patterns(self,lines:List[str])-List[Pattern]:提取代码模式patterns[]# 查找代码块后的解释in_code_blockFalsecode_content[]forlineinlines:ifline.strip().startswith():ifin_code_block:# 代码块结束ifcode_content:patternself._analyze_code_pattern(code_content)ifpattern:patterns.append(pattern)code_content[]in_code_blocknotin_code_blockelifin_code_block:code_content.append(line)returnpatternsdef_extract_architecture_patterns(self,lines:List[str])-List[Pattern]:提取架构决策patterns[]fori,lineinenumerate(lines):ifany(kwinlineforkwin[决定,选择,采用,使用]):contextself._get_context(lines,i,2)# 判断是否包含理由has_reasonany(kwincontextforkwin[因为,由于,reason,because])ifhas_reason:patterns.append(Pattern(categoryarchitecture,descriptionline.strip()[:150],evidencecontext[:200],confidence0.75ifhas_reasonelse0.5,occurrences1))returnpatternsdef_get_context(self,lines:List[str],index:int,radius:int)-str:获取上下文startmax(0,index-radius)endmin(len(lines),indexradius1)return\n.join(lines[start:end])def_summarize_debug(self,context:str)-str:总结调试模式# 简化返回前 100 个字符returncontext[:100].replace(\n, )def_analyze_code_pattern(self,code_lines:List[str])-Optional[Pattern]:分析代码模式code\n.join(code_lines)# 启发式超过 3 行的代码块可能包含模式iflen(code_lines)3:returnNonereturnPattern(categorycoding,descriptionf代码模式 ({len(code_lines)}行),evidencecode[:300],confidence0.6,occurrences1)classSkillGenerator: Skill 生成器将提取的模式转换为 SKILL.md 格式 defgenerate(self,pattern:Pattern,skill_name:str)-str: 生成 Skill 内容 Args: pattern: 提取的模式 skill_name: Skill 名称 Returns: Markdown 格式的 SKILL.md 内容 returnf---name:{skill_name}description:{pattern.description}origin:auto-extracted confidence:{pattern.confidence}---# {skill_name}## 使用场景根据模式自动分类{pattern.category}## 模式描述{pattern.description}## 证据{pattern.evidence[:500]}## 注意事项 - 此 Skill 从会话自动提取置信度为 {pattern.confidence} - 建议人工审查后使用 - 出现次数: {pattern.occurrences} ## 待完善 - [ ] 补充更详细的使用步骤 - [ ] 添加更多示例 - [ ] 验证在不同场景的有效性 def save(self, skill_name: str, content: str, base_dir: str skills) - str: 保存 Skill 到文件 skill_dir Path(base_dir) / skill_name skill_dir.mkdir(parentsTrue, exist_okTrue) skill_file skill_dir / SKILL.md skill_file.write_text(content, encodingutf-8) return str(skill_file) # 使用示例 if __name__ __main__: # 模拟会话文本 session_text 用户: 数据库连接超时怎么解决助手: 这个问题通常由连接池配置不当引起。检查一下 max_connections 是否设置合理。用户: 我把 max_connections 从 10 改成 50问题解决了助手: 很好。另外建议开启连接复用避免频繁创建连接。用户: 好的。还有一个问题Python 中处理大量数据的最佳方式是什么助手: 推荐使用生成器模式避免一次性加载所有数据到内存。 python def process_large_file(path): with open(path) as f: for line in f: yield process_line(line)用户: 这个方案有效内存占用降低了很多。“”extractor PatternExtractor(confidence_threshold0.6) patterns extractor.extract(session_text) print( * 60) print( 提取的模式) print( * 60) generator SkillGenerator() for i, pattern in enumerate(patterns): print(f\n{i1}. [{pattern.category}] 置信度: {pattern.confidence}) print(f 描述: {pattern.description[:80]}...) # 生成 Skill skill_name fauto-pattern-{i1} content generator.generate(pattern, skill_name) path generator.save(skill_name, content, /tmp/skills) print(f 已保存: {path})--- ## 四、置信度评分机制 ### 4.1 评分维度 | 维度 | 权重 | 说明 | |------|------|------| | **证据充分性** | 30% | 是否有明确的解决证据 | | **可复用性** | 25% | 是否通用而非特定场景 | | **简洁性** | 20% | 描述是否清晰简洁 | | **验证次数** | 15% | 是否在多次会话中出现 | | **领域相关性** | 10% | 是否属于核心开发领域 | ### 4.2 人工审查工作流 mermaid graph LR A[自动提取模式] -- B{置信度 0.9?} B --|是| C[自动入库] B --|否| D[人工审查队列] D -- E[开发者审查] E -- F{有效?} F --|是| G[完善后入库] F --|否| H[丢弃] G -- I[提升置信度]图 2置信度驱动的审查工作流 —— 高置信度自动入库低置信度人工审查五、总结持续学习不是让 AI 变成全知全能而是避免重复学习同一课。阶段关键动作产出会话中标记有效/无效方法原始数据会话结束Stop Hook 提取模式候选模式定期审查人工验证和完善高质量 Skill团队共享同步到 skills/ 目录组织知识参考资料ECC continuous-learning SkillECC 详细指南the-longform-guide.md持续学习章节Pattern Recognition in Software EngineeringKnowledge Management SystemsECC v1.2 发布说明Instinct-based Learning本文完。你的 AI 助手在学习吗

万字长文 | 彻底搞懂传输层：从三次握手到QUIC，构建高可靠网络通信的终极指南

🚀 万字长文 | 彻底搞懂传输层：从三次握手到QUIC，构建高可靠网络通信的终极指南摘要：传输层是互联网通信的“大动脉”，它承上启下，将应用层的业务逻辑与网络层的底层传输完美连接。本文是一篇关于传输层的…

2026/5/22 3:44:14 阅读更多

工程实战：基于 GPIO 物理旁路极速部署机器人电梯调度系统的设计

摘要： 在智能园区的多机协同配送业务中，如果上位机调度系统需要实施团队强行拆改底层电梯主板来获取协议数据，不仅实施成本极高，且极难在医院短促的施工窗口期内完成。面对安全与工期的双重限制，架构师亟需一种高度集成…

2026/5/22 3:43:53 阅读更多

本科论文不用熬大夜？paperxie 智能写作，把万字初稿的时间从 30 天压到 3 小时

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/AI PPThttps://www.paperxie.cn/ai/dissertationhttps://www.paperxie.cn/ai/dissertation 又到了每年毕业生最焦虑的时刻：打开空白的 Word 文档，盯着 “毕业论文” 四个字发呆&…

2026/5/22 3:43:33 阅读更多

AspectCore-Framework完整指南：从零开始构建可扩展的.NET应用

AspectCore-Framework完整指南：从零开始构建可扩展的.NET应用【免费下载链接】AspectCore-Framework AspectCore is an AOP-based cross platform framework for .NET Standard. 项目地址: https://gitcode.com/gh_mirrors/as/AspectCore-Framework AspectC…

2026/5/22 4:31:43 阅读更多

Android-examples API参考指南：掌握常用Android API的正确用法 [特殊字符]

Android-examples API参考指南：掌握常用Android API的正确用法 🚀 【免费下载链接】android-examples :shipit: [Examples] Simple basic isolated apps, for budding android devs. 项目地址: https://gitcode.com/gh_mirrors/an/android-examples …

2026/5/22 4:31:43 阅读更多

如何快速掌握Prism-Samples-Wpf交互性编程：InvokeCommandAction事件驱动开发终极指南

如何快速掌握Prism-Samples-Wpf交互性编程：InvokeCommandAction事件驱动开发终极指南【免费下载链接】Prism-Samples-Wpf Samples that demonstrate how to use various Prism features with WPF 项目地址: https://gitcode.com/gh_mirrors/pr/Prism-Samples-Wpf…

2026/5/22 4:31:22 阅读更多

feh主题系统完全指南：如何自定义界面外观和风格

feh主题系统完全指南：如何自定义界面外观和风格【免费下载链接】feh a fast and light image viewer 项目地址: https://gitcode.com/gh_mirrors/fe/feh feh是一款轻量级图片查看器，以其高效和简洁著称。本文将详细介绍如何通过feh的主题系统自定…

2026/5/22 4:31:22 阅读更多

image.nvim API完全手册：从基础操作到高级图像处理

image.nvim API完全手册：从基础操作到高级图像处理【免费下载链接】image.nvim 🖼️ Bringing images to Neovim. 项目地址: https://gitcode.com/gh_mirrors/im/image.nvim image.nvim是一款革命性的Neovim插件，它让开发者能够在终端…

2026/5/22 4:30:22 阅读更多

解密fbcp-ili9341：树莓派SPI显示驱动的5大核心优化技术

解密fbcp-ili9341：树莓派SPI显示驱动的5大核心优化技术【免费下载链接】fbcp-ili9341 A blazing fast display driver for SPI-based LCD displays for Raspberry Pi A, B, 2, 3, 4 and Zero 项目地址: https://gitcode.com/gh_mirrors/fb/fbcp-ili9341 fbc…

2026/5/22 4:30:22 阅读更多

单日大涨4.52%！华泰柏瑞中韩半导体ETF（513310.SH）上演“高热度”行情，溢价率风险引关注

5月21日，华泰柏瑞中韩半导体ETF（513310.SH）延续强势表现，当日收盘价报5.625元，涨幅达4.52%，盘中交投异常活跃，换手率109.80%，量比为1.32，市场资金交易热情高涨。然而&…

2026/5/22 0:00:46 阅读更多

11. 架构：前端工程化与状态管理实战

写在前面：如果说后端 MVT 引擎是 GIS 系统的“心脏”，那么前端就是它的“大脑”和“面孔”。在现代 WebGIS 开发中，如何优雅地管理复杂的图层状态、如何处理海量瓦片的渲染逻辑，是决定项目成败的关键。今天，我们将深入 light-mvt-server 的前端核心，看看如何利用 Vite …

2026/5/22 0:01:27 阅读更多

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟

淘金币自动化脚本终极指南：10分钟搞定淘宝日常任务，每天为你节省20分钟【免费下载链接】taojinbi 淘宝淘金币自动执行脚本，包含蚂蚁森林收取能量，芭芭农场全任务，解放你的双手项目地址: https://gitcode.com/gh_mi…

2026/5/22 0:02:07 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/21 8:30:37 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/21 16:37:36 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…