Claude Code 的动态工作流：为什么 Agent 不该所有任务都走同一套流程？

发布时间：2026/6/28 2:25:52

目录一、为什么要讨论动态工作流二、固定工作流的问题三、什么是 Dynamic Workflows四、Agent 如何选择最佳路径五、三种核心工作流Direct、Plan、Research六、Direct 模式简单任务直接执行七、Plan 模式中等复杂任务先规划再执行八、Research 模式复杂开放任务先研究再行动九、动态工作流和 Agent Loop 的关系十、一个复杂例子从需求到方案设计十一、一个简单例子修复错别字十二、动态工作流的真正价值十三、如何在自己的 Agent 中设计动态工作流十四、容易踩的坑十五、总结最近看 Claude Code、Codex、AI Agent 编程助手时会发现一个越来越重要的趋势Agent 不应该所有任务都走同一套流程。以前我们设计 Agent经常会把流程写死。比如无论用户让它修一个错别字还是让它设计一个复杂架构都走同样的流程理解任务 - 制定计划 - 搜索资料 - 修改文件 - 运行测试 - 总结结果这个流程看起来很完整但实际使用时会有问题。如果任务很简单它会显得太慢。如果任务很复杂它又可能思考得不够深。如果任务很开放它甚至可能在没有理解清楚之前就开始动手。所以越来越多 Agent 系统开始强调一种能力根据任务复杂度动态选择不同工作流。这就是 Dynamic Workflows 的核心思想。一、为什么要讨论动态工作流先想一个很简单的问题。你让 AI 做两件事任务 A把 README 里的一个错别字改掉。任务 B帮我设计一个支持多租户、多权限、多模型调度的 AI Agent 平台架构。这两个任务显然不应该走同一套流程。任务 A 很简单Agent 最好直接做找到错别字 - 修改 - 完成任务 B 很复杂Agent 如果直接开始写代码风险会很高。它应该先做理解业务背景 - 分析约束 - 调研可选方案 - 比较架构路线 - 提出设计 - 等用户确认 - 再进入实现这就是动态工作流的意义。它不是为了让 Agent 看起来更高级而是为了让 Agent 在不同任务上使用不同的工作方式。一句话简单任务不要过度思考复杂任务不要草率执行。二、固定工作流的问题固定工作流最大的问题是它假设所有任务都一样。但真实任务并不一样。有些任务非常明确把 package.json 里的版本号从 1.0.0 改成 1.0.1。有些任务中等复杂给登录页面增加记住密码功能。有些任务高度开放帮我评估这个项目是否适合迁移到微服务架构。如果所有任务都走同一套流程就会出现三个问题。1. 简单任务被复杂化比如用户只是让 Agent 格式化一段代码。固定工作流可能会这样做先分析需求再读取项目结构再制定计划再搜索相关文件再检查测试配置最后才格式化代码这就有点过了。用户本来只想要一个快速结果Agent 却绕了一大圈。2. 复杂任务被简单化反过来如果用户让 Agent 做一个复杂架构设计但 Agent 直接开写代码也会出问题。它可能没有弄清楚业务边界是什么性能要求是什么部署环境是什么权限模型是什么数据隔离要求是什么后续扩展方向是什么结果就是代码写得很快但方向可能错了。3. 无法适配任务复杂度固定流程最大的问题是缺少弹性。它不能根据任务变化调整思考深度。真正有用的 Agent不应该只是“执行流程”而应该先判断这个任务简单吗是否需要计划是否需要调研是否需要用户确认是否可以直接执行这就是动态工作流要解决的问题。三、什么是 Dynamic WorkflowsDynamic Workflows可以理解成Agent 根据任务的复杂度、模糊度、风险和所需工作量自动选择合适的执行流程。也就是说Agent 不再固定走一条路而是先判断任务类型再选择路径。一个简单抽象是用户任务 - 判断任务复杂度 - 选择工作流 - 按工作流执行 - 根据结果动态调整 - 交付结果如果任务简单Direct直接执行如果任务中等复杂Plan先计划再执行如果任务复杂、开放、不确定Research先研究再设计再执行这三个模式可以看作动态工作流的基本骨架。四、Agent 如何选择最佳路径Agent 选择工作流时通常需要判断几个维度。1. 任务是否明确明确任务把这个函数名从 getUser 改成 getCurrentUser。模糊任务帮我优化一下用户系统。任务越模糊越需要计划或研究。2. 改动范围是否大小范围任务改一个按钮文案。大范围任务重构整个登录鉴权流程。范围越大越不能直接执行。3. 风险是否高低风险任务补充注释格式化文档修复错别字高风险任务修改支付逻辑修改权限系统修改数据库迁移删除历史代码风险越高越需要计划、验证和确认。4. 是否需要外部信息不需要调研把现有接口返回值改成驼峰命名。需要调研比较 LangGraph、AutoGen 和 OpenAI Agents SDK选一个适合当前项目的方案。需要外部资料、方案比较、技术判断时就更适合 Research 模式。5. 是否存在多种可行方案如果只有一种明显做法可以直接做。如果存在多种路线就应该先分析。比如我要给系统加缓存。这可能有很多方案本地缓存 Redis 缓存 CDN 缓存数据库查询缓存应用层 memoization这时 Agent 不应该直接选一个而应该先比较。五、三种核心工作流Direct、Plan、Research动态工作流可以先从三个基础模式理解1. Direct直接执行 2. Plan计划驱动 3. Research研究驱动它们适合不同任务。Direct 适合简单、明确、低风险任务 Plan 适合中等复杂、有多步骤的任务 Research 适合复杂、开放、不确定的任务可以这样记Direct快 Plan稳 Research深这三个模式不是互相割裂的。复杂任务可能先走 Research然后进入 Plan最后局部任务用 Direct 完成。例如先 Research研究技术方案再 Plan制定实施步骤再 Direct修改具体文件这才是真正的动态。六、Direct 模式简单任务直接执行Direct 模式适合简单、明确、低风险的任务。比如修复一个错别字格式化一个文件补充一个 README 示例把按钮文案从“提交”改成“保存” 删除一个未使用 importDirect 模式的流程很短理解任务 - 执行 - 简单检查 - 汇报例子用户把首页按钮文案“开始使用”改成“立即体验”。Agent 可以直接1. 搜索“开始使用” 2. 找到对应文件 3. 修改文案 4. 简单确认没有其他同名误改 5. 汇报完成这种任务如果还要长篇计划就会降低效率。Direct 模式的原则是能直接做的事不要过度设计。但 Direct 也有边界。如果任务看起来简单但涉及高风险区域比如支付、权限、生产配置就不应该直接做。七、Plan 模式中等复杂任务先规划再执行Plan 模式适合中等复杂度任务。比如新增一个功能修复一个跨文件 Bug 重构一个模块为接口增加权限校验给页面增加一个筛选条件这类任务通常不是一步完成需要拆解。Plan 模式的流程大概是理解目标 - 查看相关文件 - 制定计划 - 分步骤执行 - 每一步验证 - 汇报结果例子用户给用户列表页增加按角色筛选的功能。Agent 不应该立刻乱改而应该先计划1. 找到用户列表页组件 2. 查看当前筛选逻辑 3. 查看后端接口是否支持 role 参数 4. 如果支持接入前端筛选 5. 如果不支持补充接口参数 6. 更新测试 7. 运行验证Plan 模式的价值是降低混乱。它让 Agent 在执行前先建立路线图。这对于多文件、多步骤任务尤其重要。八、Research 模式复杂开放任务先研究再行动Research 模式适合复杂、开放、不确定的任务。比如帮我设计一个 Agent 评测系统评估当前项目是否要上微服务比较三种向量数据库方案设计一个多模型路由架构调研 Claude Code 和 Codex 的工程差异这类任务最大特点是没有唯一答案需要比较方案需要理解背景需要权衡利弊Research 模式一般会这样做理解问题 - 收集上下文 - 调研资料 - 比较方案 - 给出建议 - 等确认 - 再进入实现例子用户帮我设计一个 Agent Eval 系统。Agent 应该先问或自行整理评测对象是什么是代码 Agent、客服 Agent还是数据分析 Agent 任务是否可自动验证是否需要人工评审有没有历史失败案例评测结果要用于模型选择还是用于上线门禁然后再给出架构任务集轨迹采集自动评分器 LLM 评分器人工抽检回归测试报告系统持续改进流程Research 模式的关键词是“先弄清楚”。它不是慢而是避免在错误方向上快速前进。九、动态工作流和 Agent Loop 的关系如果你已经了解 Agent Loop可以这样理解Agent Loop 是底层循环 Dynamic Workflows 是循环策略Agent Loop 负责目标 - 计划 - 行动 - 观察 - 更新 - 验证Dynamic Workflows 决定这个任务应该用多深的循环要不要先计划要不要先研究要不要快速执行要不要中途问用户比如 Direct 模式下Agent Loop 很短目标 - 行动 - 观察 - 完成Plan 模式下Loop 更完整目标 - 计划 - 行动 - 观察 - 修正 - 验证 - 完成Research 模式下Loop 更深目标 - 调研 - 分析 - 比较 - 方案 - 确认 - 执行 - 验证所以动态工作流不是替代 Agent Loop而是在 Agent Loop 之上增加了一层“任务路由”。十、一个复杂例子从需求到方案设计假设用户说我想给公司内部知识库加一个 AI 问答 Agent。要求能引用资料来源能控制权限回答不确定时不要胡说。请你帮我设计方案。这个任务显然不适合 Direct。它也不只是普通 Plan。它更适合 Research 模式。第一步理解任务Agent 先拆解需求目标设计内部知识库 AI 问答 Agent 要求 1. 能基于内部资料回答 2. 能引用来源 3. 能控制权限 4. 不确定时要拒答或提示不确定第二步识别关键问题Agent 会发现这里至少有几个核心问题知识库如何接入权限如何过滤检索如何做回答如何引用来源如何避免幻觉如何评测效果如何部署第三步进入 Research 模式Agent 不应该直接写代码而应该先调研和比较方案 A传统 RAG 方案 BRAG 权限过滤方案 CRAG Agent 工具调用方案 D多阶段检索 LLM rerank 引用校验第四步输出方案Agent 可以给出推荐架构用户问题 - 权限识别 - 文档检索 - 权限过滤 - 片段重排 - LLM 生成答案 - 引用来源校验 - 不确定性判断 - 输出答案第五步再进入 Plan当用户确认方案后Agent 再进入 Plan 模式1. 先实现文档索引 2. 再实现检索接口 3. 再实现权限过滤 4. 再实现问答生成 5. 最后加入引用校验和评测第六步局部 Direct在具体实现时一些小任务可以用 Direct新增一个配置项改一个函数名补一个单元测试这就是动态工作流的真实形态大任务用 Research 中任务用 Plan 小任务用 Direct它不是三选一而是可以组合。十一、一个简单例子修复错别字再看一个非常简单的例子。用户说把文档里的 agnet 改成 agent。这时 Agent 不需要 Research也不需要复杂 Plan。Direct 就够了1. 搜索 agnet 2. 替换为 agent 3. 确认没有遗漏 4. 汇报完成这就是动态工作流的另一面简单任务就应该简单完成。如果 Agent 对这种任务还要做大量分析就会显得笨重。十二、动态工作流的真正价值动态工作流的价值可以总结成五点。1. 更智能Agent 不再机械执行固定流程而是会先判断任务类型。2. 更高效简单任务快速完成复杂任务才投入更多思考。3. 更可靠复杂任务先研究和计划减少方向性错误。4. 更少干预Agent 能自己判断什么时候该直接做什么时候该深入想什么时候该问用户。5. 更好的用户体验用户不会感觉 Agent 总是在“过度流程化”也不会感觉它“太莽”。好的 Agent 应该像一个成熟的协作者小事快速处理中事先排步骤大事先问清楚、想明白十三、如何在自己的 Agent 中设计动态工作流如果你要自己设计一个 Agent可以从一个简单规则开始。1. 先判断任务类型可以让 Agent 在执行前判断任务是否明确任务是否低风险是否需要多文件修改是否需要外部信息是否存在多个方案是否需要用户确认2. 设计三种模式可以先定义Direct最多 1-3 步直接执行 Plan先列计划再分步执行 Research先调研分析再给方案3. 设置切换条件比如如果任务简单明确 - Direct 如果任务涉及多步骤 - Plan 如果任务开放模糊 - Research 如果中途发现复杂度升高 - 从 Direct 切到 Plan 如果发现缺少背景 - 从 Plan 切到 Research4. 设置停止条件无论哪种模式都要有停止条件任务完成验证通过需要用户确认连续失败缺少权限缺少关键信息5. 记录每次选择Agent 最好能说明我选择 Direct因为这是一个低风险单文件修改。我选择 Plan因为这个任务涉及多个文件和测试。我选择 Research因为这个任务有多个可行方案需要先比较。这样用户更容易信任它。十四、容易踩的坑1. 所有任务都 Research这会导致 Agent 很慢。用户只是让你改一个字你却开始做长篇调研这很影响体验。2. 所有任务都 Direct这会导致复杂任务风险很高。架构设计、权限系统、数据迁移这类任务不能直接莽。3. Plan 写得很漂亮但不执行有些 Agent 会列一个很长的计划但真正执行时没有跟随计划。计划必须服务执行。4. 不会中途切换模式一开始以为是简单任务但执行中发现牵涉很多模块这时就应该从 Direct 切换到 Plan。一开始以为是普通功能但发现有多个技术路线这时就应该切到 Research。5. 缺少验证动态工作流不是只选择流程还要验证结果。无论 Direct、Plan 还是 Research最后都要回答结果怎么证明是对的十五、总结Dynamic Workflows 的核心思想很简单不同任务应该走不同流程。简单任务Direct直接执行快速完成中等任务Plan先计划再分步执行复杂开放任务Research先研究再设计方案它解决的是 Agent 的“路径选择”问题。如果说 Agent Loop 让 AI 从“会回答”变成“会做事”那么 Dynamic Workflows 让 AI 从“会做事”进一步变成“会选择正确方式做事”。真正好的 Agent不是永远深度思考也不是永远快速执行而是知道什么时候该快什么时候该稳什么时候该深什么时候该问人什么时候该停止这就是动态工作流最重要的意义。

可穿戴设备为什么这么在意低功耗？μA 级传感器背后的门道

可穿戴设备为什么这么在意低功耗？μA 级传感器背后的门道做智能手表、智能手环、智能戒指这类产品，最让工程师头疼的问题之一是什么？不是功能不够多，而是——电池不够用。用户希望设备 24 小时戴着，白天测心率&#xf…

2026/6/28 2:25:52 阅读更多

次函数图像工厂：用 SymPy 自动生成 y=kx+b 对比动画

痛点场景还原假设我们想做一个简单的对比动画，在坐标系里同时画出：y2x1y−12x3如果纯用 Manim 手写，我们一般会这样写（只画其中一条的片段）：from manim import *class ManualLinear(Scene):def construct(s…

2026/6/28 2:24:52 阅读更多

moe all2all通信模式流程

场景设定 8 张 GPU，每张 GPU 上 1 个 Expert（Expert 0 在 GPU 0，Expert 1 在 GPU 1...）当前 GPU 0 上有 4 个 token，每个 token 选 top-2 专家假设 GPU 0 上 Router 的结果是： Token 选的专家目标 GPU Token A Expert 0, Expert 3 GPU 0, GPU 3 Token B Expert 1, Exp…

2026/6/28 2:22:31 阅读更多

基于SpringBoot+Vue3的超市管理系统的设计与实现

基于SpringBootVue3的超市管理系统的设计与实现一、项目介绍本项目基于 Spring Boot Vue3 技术栈，构建了一套现代化的超市管理系统。系统采用前后端分离架构，旨在为超市的商品管理、采购入库、销售收银、会员管理、数据统计等核心业务提供一体化信息化…

2026/6/28 3:49:39 阅读更多

# 企业建站选错方向，烧钱还白费？营销型 vs 定制型，一篇帮你选对

很多老板准备建网站，第一句话就是：“做个网站多少钱？” 但比价格更值得想清楚的，其实是——你究竟需要什么样的网站。选错了，它只是一张线上名片，放在那里无人问津。选对了，它是 24 小时不停歇…

2026/6/28 3:47:59 阅读更多

Next.js + React：为什么现代CMS应该抛弃PHP？

2026年，如果你还在用PHP搭建内容管理系统，也许该停下来想一想——时代变了。 WordPress至今仍占据约42.4% 的网站份额，在CMS市场中占比约60%。这个数字看起来坚不可摧，但仔细看趋势——WordPress的市场份额正在下降。从2025年12月…

2026/6/28 3:47:59 阅读更多

【数据库系统原理】第39篇：NewSQL与内存数据库：消除阻抗失配的技术革新

目录一、NewSQL的使命：在分布式时代重建ACID 二、Spanner：全球时钟与分布式一致性三、CockroachDB与TiDB：开源世界的NewSQL实践四、内存数据库：以内存为主场的架构重构五、内存数据库的持久化策略六、反规范化的数据模型…

2026/6/28 3:47:59 阅读更多

Python命令行运行、解释器详解、IDE工具(PyCharm+VSCode)使用，新手致命避坑点

上一篇我们搞懂了编程语言的本质、Python核心特点、全场景应用以及完整环境安装，也分清了编译型语言和解释型语言的区别。一、命令行（黑框窗口）运行Python代码1. 什么是命令行？就是电脑自带的黑色弹窗窗口，Windows系统…

2026/6/28 3:45:37 阅读更多

大模型量化避坑：为什么直接相加 imatrix 的均值会让你精度崩盘？

LLaMA-7B 里那张 ffn_down 权重矩阵有 4500 万个数（110084096），而给它做量化的"重要性矩阵"只有 11008 个数——连权重总量的两千分之一都不到，44 KB 对 88 MB。更怪的是：这 11008 个数里没有一个来自权重本身。它们全是输入激活的平方和 Σx，一个数管一整列…

2026/6/28 3:44:56 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

2026/6/28 0:00:03 阅读更多

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:01:08 阅读更多

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

2026/6/28 1:02:09 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/27 12:47:04 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/27 13:25:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/27 13:25:16 阅读更多

相关文章

可穿戴设备为什么这么在意低功耗？μA 级传感器背后的门道

次函数图像工厂：用 SymPy 自动生成 y=kx+b 对比动画

moe all2all通信模式流程

基于SpringBoot+Vue3的超市管理系统的设计与实现

# 企业建站选错方向，烧钱还白费？营销型 vs 定制型，一篇帮你选对

Next.js + React：为什么现代CMS应该抛弃PHP？

【数据库系统原理】第39篇：NewSQL与内存数据库：消除阻抗失配的技术革新

Python命令行运行、解释器详解、IDE工具(PyCharm+VSCode)使用，新手致命避坑点

大模型量化避坑：为什么直接相加 imatrix 的均值会让你精度崩盘？

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

华为OD机试2025C卷-字符统计及重排[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

华为OD机试2025C卷-寻找相同子串[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因