用过各类 AI Coding Agent 的开发者大概率都体验过一种隐隐的失控感 AI 啪啪啪一通操作改了十几处文件丢给你一个巨大的 Diff。你扫了一眼感觉好像没啥大问题手一抖就点了“Merge合并”。恭喜你你已经从一个掌握主导权的架构师退化成了 AI 的“一键审批按钮”。长此以往不仅代码库成了黑箱你自己的技术能力也会逐渐退化。为了对抗这种“智能体黑箱”Anthropic 的 Claude Code 核心开发者trq212ThariqS以及团队成员 Suzanne 近日分享了一套在 Anthropic 内部备受推崇的高价值 Prompt 技能——「人机结对编程中的“理解验证”工作流」。这套工作流的核心定位是让 AI 扮演一个「高效且睿智的教师」不仅帮你把活干了还要确保在会话结束时你对问题、方案和潜在影响都有可复述、可辩护的深度掌握。一、 核心颠覆从 Task Runner 到 Wise Teacher绝大多数常见 Agent 的工作模式是一口气做完——结尾总结一句“你应该懂了吧” ——结束。而 Anthropic 开发者推崇的这套工作流其成功标准绝不仅仅是“任务完成”而是人类是否真正理解了整场会话。它的核心差异在于每步增量教学不一口气跨多个阶段过关才允许进入下一阶段。先让用户复述AI 根据复述诊断思维缺口再精准补课。必须通过清单 变式测验 演示理解会话才被允许收工。为了做到这一点工作流要求 AI 在协作过程中要有三条理解轴你的 Running Markdown 清单必须覆盖这些内容理解维度核心追问内容反复追问 Why → 更深层的 Why MD1. 问题域 (Problem)这是个什么问题为什么会出现根因、历史背景、分支路径是什么曾有哪些被否决的取舍路线2. 方案域 (Solution)做了什么修改为什么这么解核心的设计决策与 Trade-off权衡是什么边界情况与失败模式有哪些3. 语境域 (Context)这次改动在整个系统/业务里意味着什么会影响到谁、什么流程存在什么潜在风险提炼问题理解不到位方案理解往往是假的。二、 8步执行节拍拆解可执行的操作流程在实际结对编程中这套工作流遵循极其严密的8 步操作节拍做完一小步AI 只推进一个可验收的小单元如仅定位根因或仅改一处逻辑绝不连跑带跳。先让用户复述在推进下一步前AI 会主动要求用户用自己的话说明这一步在解决什么为什么这么做还有什么不确定注意这是诊断不是泄题按缺口补课AI 根据用户的复述寻找认知空洞针对性地补动机或业务逻辑。此时可自由切换抽象层级如ELI5 傻瓜式讲解、ELI14 极客式讲解、或“把我当成实习生来解释”。小范围验证AI 抛出开放题或多选题来检查用户是否真懂。如果是选择题AI 会打乱正确选项顺序且在用户提交前绝不公布对错防止人类瞎猜。过关才前进只有当同一阶段在高层为何做和低层怎么做、边界在哪都得到确认后AI 才会开启下一个小任务。同步更新清单在运行的 Markdown 文档里动态勾选或补充用户应掌握的具体条目。必要时绑到真实材料如果口头解释太抽象AI 会直接贴出相关代码片段或者引导人类一起用调试器Debugger走一遍避免出现“听懂了但对着 Diff 仍说不清”的尴尬。收工条件会话结束前清单上的每一项都必须由人类表现出完全掌握能复述、能答题、能解释 trade-off否则不予结项。三、 Anthropic 内部为何极力推崇这套设计这套看起来甚至有点“折腾”、“低效”的工作流为什么能在顶级 AI 公司的核心核心圈子里流行起来消除认知过载把长会话中庞大的认知负荷均匀摊平到了全程的增量确认中人类不再容易沦为盲目点赞的工具人。强制隐性知识显性化Tacit Knowledge大模型在推理过程中产生的很多奇思妙想、被否决的边界 Case、废弃的分支方案往往只存在于它的 Context上下文里。这套清单机制强制将这些高价值的隐性技术资产沉淀成文档。可审计的交付无论是为了团队后续的 Code Review还是几个月后倒查“当时为什么这么改”都有极其清晰的逻辑线索可依。与产品风险对齐只有当你真正懂了代码改动的 Impact影响面你才谈得上是 Responsible Shipping负责任的交付而不仅仅是凑巧让单元测试跑通。四、 落地实操要点如果你想在自己的开发流中接入这套 Skill请牢记以下几点清单是活文档它随会话演进不断增删项绝不是一次性的大纲。测验要多变严防背答案多选题要经常轮换选项位置。层级要交替逼迫自己在“动机 $\leftrightarrow$ 实现 $\leftrightarrow$ 边界”之间反复横跳防止自己只会背概念或者只会盯着 Diff 抠细节。会话可拉长这种拉长是刻意为之的——在真正的工业级开发中深度理解的优先级永远高于速度。附Anthropic 核心原版 Prompt 备份你可以将以下这段 Suzanne 的Prompt 直接喂给你的 Claude 或自定义 Agent在 AI 编码能跑出成百上千并行 Agent 的 2026 年写代码本身的门槛正在无限隐形。而拉开底层开发者与顶级架构师差距的正是这种“对系统全局与细节的绝对掌控力”。快把这套工作流用起来吧最近魔芋ai平台推出流行大模型的6折优惠包括Seedance2.0、GPT、Gemini、Claude等流行模型完全透明token计费可供企业开发票使用。魔芋AI想AI创业的朋友们可以来看Raas100开发者招募海量资金扶持一站式赋能助力大家实现AI创业的想法。欢迎加入群聊了解更多。获取折扣福利加入开发者招募获取更多ai资讯。添加我为微信好友
Anthropic 开发者分享 Claude Code 核心工作流:「理解验证」工作流
发布时间:2026/6/2 21:50:38
用过各类 AI Coding Agent 的开发者大概率都体验过一种隐隐的失控感 AI 啪啪啪一通操作改了十几处文件丢给你一个巨大的 Diff。你扫了一眼感觉好像没啥大问题手一抖就点了“Merge合并”。恭喜你你已经从一个掌握主导权的架构师退化成了 AI 的“一键审批按钮”。长此以往不仅代码库成了黑箱你自己的技术能力也会逐渐退化。为了对抗这种“智能体黑箱”Anthropic 的 Claude Code 核心开发者trq212ThariqS以及团队成员 Suzanne 近日分享了一套在 Anthropic 内部备受推崇的高价值 Prompt 技能——「人机结对编程中的“理解验证”工作流」。这套工作流的核心定位是让 AI 扮演一个「高效且睿智的教师」不仅帮你把活干了还要确保在会话结束时你对问题、方案和潜在影响都有可复述、可辩护的深度掌握。一、 核心颠覆从 Task Runner 到 Wise Teacher绝大多数常见 Agent 的工作模式是一口气做完——结尾总结一句“你应该懂了吧” ——结束。而 Anthropic 开发者推崇的这套工作流其成功标准绝不仅仅是“任务完成”而是人类是否真正理解了整场会话。它的核心差异在于每步增量教学不一口气跨多个阶段过关才允许进入下一阶段。先让用户复述AI 根据复述诊断思维缺口再精准补课。必须通过清单 变式测验 演示理解会话才被允许收工。为了做到这一点工作流要求 AI 在协作过程中要有三条理解轴你的 Running Markdown 清单必须覆盖这些内容理解维度核心追问内容反复追问 Why → 更深层的 Why MD1. 问题域 (Problem)这是个什么问题为什么会出现根因、历史背景、分支路径是什么曾有哪些被否决的取舍路线2. 方案域 (Solution)做了什么修改为什么这么解核心的设计决策与 Trade-off权衡是什么边界情况与失败模式有哪些3. 语境域 (Context)这次改动在整个系统/业务里意味着什么会影响到谁、什么流程存在什么潜在风险提炼问题理解不到位方案理解往往是假的。二、 8步执行节拍拆解可执行的操作流程在实际结对编程中这套工作流遵循极其严密的8 步操作节拍做完一小步AI 只推进一个可验收的小单元如仅定位根因或仅改一处逻辑绝不连跑带跳。先让用户复述在推进下一步前AI 会主动要求用户用自己的话说明这一步在解决什么为什么这么做还有什么不确定注意这是诊断不是泄题按缺口补课AI 根据用户的复述寻找认知空洞针对性地补动机或业务逻辑。此时可自由切换抽象层级如ELI5 傻瓜式讲解、ELI14 极客式讲解、或“把我当成实习生来解释”。小范围验证AI 抛出开放题或多选题来检查用户是否真懂。如果是选择题AI 会打乱正确选项顺序且在用户提交前绝不公布对错防止人类瞎猜。过关才前进只有当同一阶段在高层为何做和低层怎么做、边界在哪都得到确认后AI 才会开启下一个小任务。同步更新清单在运行的 Markdown 文档里动态勾选或补充用户应掌握的具体条目。必要时绑到真实材料如果口头解释太抽象AI 会直接贴出相关代码片段或者引导人类一起用调试器Debugger走一遍避免出现“听懂了但对着 Diff 仍说不清”的尴尬。收工条件会话结束前清单上的每一项都必须由人类表现出完全掌握能复述、能答题、能解释 trade-off否则不予结项。三、 Anthropic 内部为何极力推崇这套设计这套看起来甚至有点“折腾”、“低效”的工作流为什么能在顶级 AI 公司的核心核心圈子里流行起来消除认知过载把长会话中庞大的认知负荷均匀摊平到了全程的增量确认中人类不再容易沦为盲目点赞的工具人。强制隐性知识显性化Tacit Knowledge大模型在推理过程中产生的很多奇思妙想、被否决的边界 Case、废弃的分支方案往往只存在于它的 Context上下文里。这套清单机制强制将这些高价值的隐性技术资产沉淀成文档。可审计的交付无论是为了团队后续的 Code Review还是几个月后倒查“当时为什么这么改”都有极其清晰的逻辑线索可依。与产品风险对齐只有当你真正懂了代码改动的 Impact影响面你才谈得上是 Responsible Shipping负责任的交付而不仅仅是凑巧让单元测试跑通。四、 落地实操要点如果你想在自己的开发流中接入这套 Skill请牢记以下几点清单是活文档它随会话演进不断增删项绝不是一次性的大纲。测验要多变严防背答案多选题要经常轮换选项位置。层级要交替逼迫自己在“动机 $\leftrightarrow$ 实现 $\leftrightarrow$ 边界”之间反复横跳防止自己只会背概念或者只会盯着 Diff 抠细节。会话可拉长这种拉长是刻意为之的——在真正的工业级开发中深度理解的优先级永远高于速度。附Anthropic 核心原版 Prompt 备份你可以将以下这段 Suzanne 的Prompt 直接喂给你的 Claude 或自定义 Agent在 AI 编码能跑出成百上千并行 Agent 的 2026 年写代码本身的门槛正在无限隐形。而拉开底层开发者与顶级架构师差距的正是这种“对系统全局与细节的绝对掌控力”。快把这套工作流用起来吧最近魔芋ai平台推出流行大模型的6折优惠包括Seedance2.0、GPT、Gemini、Claude等流行模型完全透明token计费可供企业开发票使用。魔芋AI想AI创业的朋友们可以来看Raas100开发者招募海量资金扶持一站式赋能助力大家实现AI创业的想法。欢迎加入群聊了解更多。获取折扣福利加入开发者招募获取更多ai资讯。添加我为微信好友