【LLM】CC 一、什么是 Claude CodeClaude Code 是 Anthropic 发布的一款智能体编码工具Agentic Coding Tool它有一个智能体循环Agentic Loop——可以规划并执行动作以完成目标能调用工具、评估结果并持续运行直到任务完成。[1]它是一个能读取代码库、跨文件修改代码、运行测试并提交代码的自主编码系统。对于没有工程背景的构建者来说它是一个此前从未有过的软件开发入口。[3]传统 AI 编程助手如 GitHub Copilot只在 IDE 中提供自动补全建议而 Claude Code 采用了根本不同的方式——它运行在终端中直接与文件系统和命令行工具交互。[7]Anthropic 于 2025 年 2 月将 Claude Code 作为有限研究预览版推出三个月后的 2025 年 5 月正式面向公众开放。[7]二、整体架构设计Claude Code 的架构设计有一个极具颠覆性的特点整个代码库中只有 1.6% 是 AI 决策逻辑其余 98.4% 是确定性的基础设施——权限门控、上下文管理、工具路由和恢复逻辑。[4]系统的核心是一个简单的 while 循环调用模型、运行工具、重复但大部分代码分布在这个循环周围的系统中一个具有七种模式和基于 ML 分类器的权限系统、用于上下文管理的五层压缩流水线等。[8]核心循环被描述为一种ReAct 风格Reasoning and Acting的响应模式模型提议动作工具执行它们而周围的系统则强制执行安全性和连续性。[2]整个架构的设计出发点是五个核心人类价值观人类决策权威、安全与保障、可靠执行、能力扩展以及情境适应性并通过 13 个设计原则落实到具体实现中。[8]三、整体分为几个主要部分根据对 Claude Code TypeScript 源码的深度分析系统拥有一个七组件的基础设施架构将所有接口交互汇聚到一个统一的智能体循环中严格将底层语言模型的推理能力与操作安全、上下文、内存管理三者分离。[10]1. 智能体核心循环Agentic LoopClaude Code 读取代码库、规划动作序列、使用真实开发工具执行、评估结果并调整方案。开发者设定目标并保留对提交内容的控制权但执行循环独立运行。[3]2. 权限系统Permission SystemClaude Code 实现了四大设计原则拒绝优先人工升级、分级信任谱、纵深防御多层机制、以可逆性为权重的风险评估。[1]在 Claude Code 的拒绝/询问/允许规则中拒绝匹配优先因此即使存在更广泛的权限被阻止的操作也会保持阻止状态防止高风险操作在模糊时刻溜过。[2]3. 上下文管理Context Management该系统通过一个渐进式五层压缩管道来管理无限制的上下文压力。[10] 当会话消耗大量上下文后系统会自动压缩历史对话确保工作的连续性。4. 扩展机制Extension Layer系统使用四种不同的扩展机制按上下文占用量严格分级事件驱动的生命周期 Hooks零默认上下文、领域特定的 Skills最小指令集、可分发的插件中等成本以及 MCP 服务器高 Token 预算。通过将扩展映射到这些成本层级架构可以防止第三方集成悄悄耗尽上下文窗口。[10]5. 子智能体系统Subagent System对于复杂的重构任务主智能体可以生成子智能体如探索或规划智能体。为了保护主上下文窗口这些子智能体在隔离的 Git 工作树和独立上下文循环中运行只通过摘要报告与主智能体通信。[10]6. 内存与持久化Memory PersistenceCLAUDE.md是你添加到项目根目录的 Markdown 文件Claude Code 在每次会话开始时读取它用于设置编码规范、架构决策、首选库和审查清单。[9]Claude 还会在工作过程中自动建立记忆在会话间保存构建命令和调试见解等内容无需手动编写任何内容。[9]7. 多接口层Multi-Interface LayerClaude Code 是一款可读取代码库、编辑文件、运行命令并与开发工具集成的智能体编码工具可在终端、IDE、桌面应用和浏览器中使用。[9]它为 VS Code以及 Cursor、Windsurf和 JetBrains IDE 提供原生扩展。[5]四、常见指令大全指令在会话内部控制 Claude Code提供快速切换模型、管理权限、清除上下文、运行工作流等功能。[1] 会话管理类指令作用/init为仓库生成 CLAUDE.md项目简报/clear清除对话历史开始新任务/compact [说明]压缩长对话历史保留关键信息/rewind回滚对话和/或代码到某个检查点/resume恢复上次会话/branch创建当前对话的分支/compact是节省 Token 的利器。当长会话填满上下文窗口时它会将对话历史压缩为密集摘要还可以传入指令引导保留哪些内容如/compact 重点保留 auth 模块和当前测试失败信息。[4] 规划与审查类指令作用/plan进入只读规划模式Claude 只分析不修改文件/diff显示变更内容/review对代码进行深度只读审查/security-review专项安全漏洞审查/simplify三智能体流水线检查架构、重复逻辑和性能问题/plan也可通过 ShiftTab 切换让 Claude 进入只读模式可以读取文件、分析代码库但无法进行修改所有提议的修改都以需要明确批准的计划形式呈现。适合用于生产关键文件、数据库迁移等敏感任务。[4] 成本与状态监控类指令作用/cost查看本次会话花费API 用户/stats查看用量统计Pro/Max 用户/context查看当前上下文窗口使用情况/status查看版本、当前模型、账号连接状态⚙️ 多智能体与并行任务类指令作用/batch分解大型任务在独立工作树中并行执行/agents配置子智能体/mcp管理 MCP 服务器连接/batch可以将横跨代码库的大型变更分解为独立单元并在各自的工作树中并行运行。[1]️ 诊断与调试类指令作用/doctor诊断安装和运行时问题/debug调试会话问题/feedback附带会话上下文提交 bug 报告⌨️ 实用快捷键Esc Esc打开回滚菜单支持选择性地只回滚代码或只回滚对话AltP切换模型保留当前输入内容AltT切换扩展思考深度推理模式。[4]五、还有哪些可以优化和升级的方向✅ 已经在改进的问题Anthropic 曾将近期的质量问题追溯到三项独立变更并已全部修复v2.1.116。[3]为此Anthropic 承诺确保更多内部员工使用与公众完全相同的构建版本并为 Claude Code 的每次系统提示变更运行全面的评估套件同时对提示变更加强了审查和审计工具。[3] 六大未来开放方向来自学术研究架构研究指出重量级基础设施虽然能提升短期速度但有界的上下文窗口和孤立的子智能体架构会带来全局代码库一致性退化和长期人类理解力下降的风险。[10]具体来说有以下几个核心方向值得关注1. 跨会话持久记忆目前权限在恢复时不会被恢复——信任是按会话重新建立的设计倾向于可审计性而非查询能力。[4]未来可探索更智能的跨会话记忆与信任延续机制。2. 更智能的上下文管理随着代码库规模增长如何在超长上下文中保持全局一致性是核心挑战。Opus 4.7 专门改善了长上下文可靠性早期测试者报告称这是我们测试过的所有模型中最稳定的长上下文表现。[9]3. 成本与额度压力如果 Claude Code 是你的主要开发工具且你在标准工作时段使用仍然会触及额度限制。Pro 计划$20/月在 Opus 4.7 之后尤为紧张Max 5x$100/月对大多数工作流勉强够用。[9]4. 可观测性与评估体系随着基础模型在基准推理能力上趋于收敛自主系统可靠性的关键差异化因素变成了围绕模型的确定性工程框架。[10]如何建立更好的可观测性和评估体系是重要方向。5. 多智能体协作Claude Code 已支持生成多个并行工作的子智能体[9]但跨智能体的协调、状态共享和冲突解决仍有很大提升空间。6. 移动端与异步工作流Claude Code 正在逐渐摆脱对单一机器的依赖Anthropic 开始将 Claude Code 更多地视为一个可以从手机查看的运行会话而真实环境则锚定在用户的机器上。[4]这一方向将使 AI 编码助手真正成为 7×24 小时运转的后台服务。总体而言Claude Code 代表了从代码补全工具到自主软件工程师的范式转变。在 Anthropic 内部目前大多数代码已由 Claude Code 编写工程师则专注于架构、产品思考和持续编排——管理并行运行的多个智能体给出方向并做出决定什么被构建出来的决策。[3]Memory记忆系统Claude Code 有两套互补的记忆机制都会在每次会话开始时被加载CLAUDE.md 文件由你手动编写给 Claude 提供持久上下文和Auto MemoryClaude 根据你的纠正和偏好自动写入的笔记。[1]1. CLAUDE.md —— 手动指令层CLAUDE.md 是 Markdown 格式的文件为项目、个人工作流或整个组织提供持久指令由你用纯文本编写Claude 在每次会话开始时读取它。[1]CLAUDE.md 存在三个作用域项目级放在仓库根目录、个人级~/.claude/CLAUDE.md和组织级企业配置。[6]Claude Code 从当前工作目录开始递归向上读取一直到根目录/沿途读取所有 CLAUDE.md 和 CLAUDE.local.md 文件。位于子目录中的文件不会在启动时加载只有当 Claude 读取了那个子目录下的文件时才会按需加载。[8]2. Auto Memory —— 自动记忆层Auto Memory 让 Claude 无需你手动写任何东西就能跨会话积累知识。Claude 在工作时自动保存笔记内容包括构建命令、调试洞察、架构说明、代码风格偏好和工作流习惯。[1]存储位置在~/.claude/projects/project/memory/包含一个 MEMORY.md 入口文件和可选的主题文件。每次会话启动时加载 MEMORY.md 的前 200 行主题文件按需加载。作用域为机器本地在同一 git repo 的所有 worktree 和子目录中共享。[8]Auto Memory 捕获工作中浮现的内容。Claude 自行判断什么值得保留并将其写入机器上的 memory 目录按四类组织user角色与偏好、feedback你的纠正、project决策与上下文和 reference资源位置。[6]Claude 不会每次会话都写东西它根据信息在未来对话中是否有用来判断是否值得记忆。[1]/dream—— 记忆整合机制为什么需要 DreamAuto Memory 记录的笔记在数周使用后会逐渐腐烂写着昨天的部署 bug的条目过一周就失去意义某条笔记说你用 PostgreSQL更新的笔记说你迁移到了 MySQL已删除的文件仍有对应的记忆条目索引充满矛盾和过时引用。[6]Auto Dream 与/dream的关系/dream命令是手动触发器你可以在大改动如框架迁移或模块重命名之后运行它让 Claude 立即整合而不必等待下一个空闲窗口。两者执行的是同样的工作唯一区别是谁来决定何时启动。[7]Auto Dream 在 Claude Code 空闲时自动运行默认触发条件是距上次清理超过 24 小时且累积了至少 5 个新会话。[7]四阶段整合流程/dream触发后会启动一个后台子 Agent执行结构化的四阶段整合循环。[4]具体如下Phase 1 – Orient定向Claude 读取项目中的每一个记忆文件以及个人 MEMORY.md不做任何修改只是建立对当前状态的整体认知。[7]Phase 2 – Gather Signal采集信号扫描最近的会话记录JSONL 文件提取用户纠正、偏好变更、重要决策和反复出现的模式。使用定向 grep而非全文读取。[6]Phase 3 – Consolidate整合每条条目被归入三类仍然有用的真实的约定、偏好、上下文过时的引用了不再存在的代码、已撤销的决策重复或近似重复的同一约定用不同措辞写了两次。[7]Phase 4 – Update Index更新索引最后阶段聚焦于 MEMORY.md 索引文件将其保持在 200 行以内因为这是启动时加载的上限更新索引以准确反映所有主题文件的当前状态。[1]安全性设计Dream 读取现有记忆存储和过往会话记录然后生成一个新的、重新组织的记忆存储重复项合并、过时或矛盾条目替换为最新值。输入存储永远不会被修改所以你可以审查输出如果不满意可以丢弃。[2]整合过程在后台子 Agent 中运行——就像真正的睡眠一样不会打断你的主动工作。Dream Agent 的系统提示以这样一句话开头“You are performing a dream — a reflective pass over your memory files.”[6]理论来源这个特性的理论依据可以追溯到 2025 年 4 月 UC Berkeley 与 Letta 联合发表的论文Sleep-time ComputearXiv:2504.13171。核心发现在空闲时预计算的模型在相同精度下可将测试时算力降低 5 倍并带来最高 18% 的精度提升。[4]总结一句话Memory 是 Claude Code 的笔记本会随每次会话自动更新/dream则是定期对笔记本做REM睡眠式整理的机制删旧去冗保持记忆的准确与精炼。Dive into Claude Code: The Design Space of Today’s and Future AI Agent SystemsCommands - Claude Code DocsClaude Code Updates 2026: New Features Improvements | Get AI PerksInside Claude Code Architecture: Why Today’s Most Advanced AI Coding Agents are Powered by Infrastructure, Not Just IntelligenceClaude Code cheatsheetAnthropic explains Claude Code’s recent performance decline after weeks of user backlash | FortuneClaude Code | Anthropic’s agentic coding systemHow I use Claude Code ( my best tips)An update on recent Claude Code quality reportsGitHub - VILA-Lab/Dive-into-Claude-Code: A Systematic Analysis and Discussion of Claude Code for Designing Today’s and Future AI Agent Systems · GitHubThe Complete Developer’s Guide to Claude Code Commands | Tim DietrichEvery Claude Code Update From March 2026, ExplainedClaude Code by Anthropic | AI Coding Agent, Terminal, IDEShipyard | Claude Code CLI Cheatsheet: config, commands, prompts, best practicesClaude Code Q1 2026 Update Roundup: Every Feature That Actually Matters | MindStudioClaude Code — 2025 AI Agent IndexHow to Use Claude Code: A Guide to Slash Commands, Agents, Skills, and Plug-insEffective Claude Code Workflows in 2026: What Changed and What Works Now | by Sean Moran | Data Science Collective | Apr, 2026 | MediumWhat Is Claude Code? AI Coding Tool Explained — Shawn KanungoClaude Code, Real Workflows: Commands, Context Tools. | by Naveed Ul Mustafa | MediumClaude Code Limits: Quotas Rate Limits Guide[2604.14228] Dive into Claude Code: The Design Space of Today’s and Future AI Agent SystemsClaude Code Commands: The Ultimate ReferenceWhat’s new - Claude Code DocsOverview - Claude Code DocsGitHub - Njengah/claude-code-cheat-sheet: Ultimate collection of Claude Code tips, tricks, hacks, and workflows that you can use to master Claude Code in minutes · GitHubClaude Code Opus 4.7 Review: The 3 Changes That Matter (2026) - AI Tool AnalysisDive into Claude Code: The Design Space of Today’s and Future AI Agent Systems