Claude Code 放了两个大招Auto Mode 和 ultracode workflows怎么说呢我本来只是想更新一下自己 Claude Code 的版本结果一翻 changelog 直接愣住了。5 月 25 日到 29 日Anthropic 在 Claude Code 里一口气塞了两坨重磅东西。一个叫Auto Mode一个叫 Dynamic Workflows关键词是 ultracode。这两个东西单拎出来都已经够炸的了放在一起用直接把 Claude Code 从「一个能写代码的终端工具」推到了「一个能在你睡觉的时候自己干活的工程团队」这个量级。我这几天把它们翻了个底朝天今天在这里把研究出来的东西全部交代清楚。先说 Auto Mode它到底是个啥在讲 Auto Mode 之前先回到一个很多人用 Claude Code 都会撞上的场景。你正在用它改代码。它想跑个测试它停下来问你。删个文件它停下来问你。装个依赖它又停下来问你。改三五行配置它会连续问五次。一次两次还行问多了你真的想把键盘摔了。这就是默认 permission mode 的代价安全但打断感极强。Auto Mode 就是来治这个毛病的。按照官方 permission-modes 文档的说法Auto Mode 是一项 research preview 功能需要 Claude Code v2.1.83 或更高版本。它让 Claude 可以在没有 permission prompt 的情况下直接执行操作但会有一个独立的 classifier 模型在每个动作执行前先过一遍把那些「超出你请求范围」、「指向你没授权的基础设施」、或者「被 Claude 读到的恶意内容驱动」的动作直接拦下来。说人话就是它不是真的放手让 Claude 随便干而是「放手 一只看不见的手在兜底」。想一启动就进 Auto Mode可以在 settings 里把 claudeCode.initialPermissionMode 配成 auto。我研究出了几个挺有意思的细节。第一它会顺便降低 Claude 主动跟你确认问题的次数。也就是说它不光很少问你“能不能做”连“你到底想干啥”都问得少了。不过呢要是你在提示信息里明确说了要确认的地方Claude 还是会停下来的。第二它在开启和关闭的时候会重置你的权限规则。就是那种“允许执行任意代码”这种宽泛的允许规则在开启的时候会自动被丢弃退出 Auto Mode 之后又会恢复。这设计挺实在的就好像是承认 Auto Mode 是个更危险的状态主动把那些大刀阔斧的权限收一收。第三它有熔断机制。文档里写得明明白白的“如果分类器连续 3 次或者累计 20 次阻止某个操作Auto Mode 就会暂停Claude Code 会回到普通确认模式你手动批准一次之后才能再开启”。这两个次数的上限是不能自己设置的。第四它本身可不保证安全。官方明确说了这只是研究预览版还不能用于正式生产。文档建议你用它来运行那些“你大体上信任但又懒得每一步都盯着”的任务可别用它来替代对敏感操作的审查。第五企业用户可以用强制拒绝规则来无条件屏蔽某些操作。普通用户也能告诉分类器你信任哪些代码库、存储桶、域名这样它对内部操作的判断会更准。这一条是文档专门给团队管理员留的办法。我看到这五条的时候心里就一个念头这东西的设计逻辑不是“我相信 Claude”而是“我相信一个比 Claude 谨慎得多的裁判”。这种分层的信任模型挺值得好好琢磨琢磨的。再说 Dynamic Workflows这是把单兵变军团如果说 Auto Mode 是「让一个 Claude 干得更快」那 Dynamic Workflows 就是「让一群 Claude 一起干一件大事」。按照 workflows 文档的说法Dynamic Workflows 也是 research preview而一个动态 workflow 就是一段 JavaScript 脚本由 Claude 写出来然后一个 runtime 在后台跑它调度一大堆 subagent 去干活。关键点来了这段脚本不是预设的模板是 Claude 现场根据你的任务现编的。你描述一个任务Claude 给你写一段编排脚本runtime 在后台执行你的 session 还能继续干别的事不会被卡住。适合什么场景文档列了四个很典型的全是我过去最头疼的那种活。第一codebase-wide 的 bug 扫描。整个仓库几千个文件挨个看有没有某个模式的 bug。第二500 个文件的迁移。一次改几百个 import 路径或者签名。第三需要交叉验证的研究问题。不是一个搜索能搞定的要多个角度查再互相印证。第四需要从几个独立角度起草一个严肃方案。在你下决心之前让几个不同视角的草稿互相 PK。传统 subagent 模式干这些活是「Claude 现场决定下一步派谁」编排逻辑全在 Claude 脑子里没法复用也容易断。Workflow 把这一步从「Claude 的脑子里」搬到了「一段可以读、可以改、可以重跑的代码里」。而且 workflow 还能跑出传统 subagent 跑不出来的质量模式比如让几个独立 agent 互相 adversarial review 对方的结论最后再汇总。这其实就是把学术 peer review 的模式塞进 AI 工作流里。最让我兴奋的是workflow 是有内建质量模式的文档里专门强调了这一点。它能做的不是「多派几个 agent 一起堆」而是让这些 agent 互相挑刺、互相印证从几个角度起草方案再权衡最后给你的不是一个原始结果是一个经过内部对抗验证的结果。这一点对严肃任务太关键了。ultracode 怎么用先解释一下背景Claude Code 有一个 /effort 命令控制推理强度从低到高一般是 low、medium、high、xhigh、max 几档。ultracode 不是单独一档 effort而是文档原话「Ultracode is a Claude Code setting that combines xhigh reasoning effort with automatic workflow orchestration」也就是把 xhigh 推理强度和「自动编排 workflow」打包在一起的一个 setting。怎么开两种方式。第一种在 prompt 里直接用关键词。输入「ultracode: 把 src/routes/ 下每个 API endpoint 都审计一下有没有缺鉴权」这种 promptClaude Code 会把 ultracode 这个词高亮紫色然后直接给你写一段 workflow 脚本而不是按 turn 一句一句来。第二种用 /effort ultracode 全局开。开了之后Claude 自己判断哪些任务值得用 workflow一个简单请求可能自动变成连续好几个 workflow 串起来跑一个理解代码、一个动手改、一个验证改得对不对。每个任务都比低 effort 多花 token、慢一点但质量上一个台阶。我自己的两点冷静思考虽然挺兴奋的但我研究完之后还是想给大家泼点冷水。第一关于 token 消耗。ultracode 是高工作量加上工作流程编排每个任务消耗的 token 可不是普通模式的 1 点几倍而是好几倍呢。文档里原话是“每次请求会消耗更多的 token而且比低工作量水平时花费的时间更长”。要是你订阅的是按使用量付费或者有月度使用上限那用的时候可得悠着点别一上来就把 ultracode 设成默认模式。第二调试的复杂度。当一个工作流程运行失败时你看到的可不是“Claude 说了句错话”而是“这段编排脚本在第几个子代理的哪一步出错了”。调试的步骤变多了。文档里给的建议是用 /workflows 命令通过上下箭头选择按回车键进入进度视图这样就能看到每个代理的提示信息、工具调用情况和结果。虽然有这个功能但熟悉它还得花点时间。写在最后这周 Anthropic 做的那些事儿来来回回其实就是在回答一个问题“AI 编程工具到底能帮人干多少活儿”。Auto Mode 给出的答案是尽量少打扰你。Dynamic Workflows 给出的答案是让一群 AI 一起干活儿。ultracode 给出的答案是尽最大努力把上面这两件事打通。把这三样东西合在一起Claude Code 就不再是那种得你手把手教着用的工具了它更像是一个小型工程团队你只要下达目标它自己就能拆解目标、组织人手还能自己验收结果。这个转变意义可大了从这儿开始AI 编程比拼的就不再是“单兵作战能力”而是“工程组织能力”了。
给到夯,Claude Code重磅更新:Auto Mode 与 ultracode 是个什么东西
发布时间:2026/6/9 19:15:22
Claude Code 放了两个大招Auto Mode 和 ultracode workflows怎么说呢我本来只是想更新一下自己 Claude Code 的版本结果一翻 changelog 直接愣住了。5 月 25 日到 29 日Anthropic 在 Claude Code 里一口气塞了两坨重磅东西。一个叫Auto Mode一个叫 Dynamic Workflows关键词是 ultracode。这两个东西单拎出来都已经够炸的了放在一起用直接把 Claude Code 从「一个能写代码的终端工具」推到了「一个能在你睡觉的时候自己干活的工程团队」这个量级。我这几天把它们翻了个底朝天今天在这里把研究出来的东西全部交代清楚。先说 Auto Mode它到底是个啥在讲 Auto Mode 之前先回到一个很多人用 Claude Code 都会撞上的场景。你正在用它改代码。它想跑个测试它停下来问你。删个文件它停下来问你。装个依赖它又停下来问你。改三五行配置它会连续问五次。一次两次还行问多了你真的想把键盘摔了。这就是默认 permission mode 的代价安全但打断感极强。Auto Mode 就是来治这个毛病的。按照官方 permission-modes 文档的说法Auto Mode 是一项 research preview 功能需要 Claude Code v2.1.83 或更高版本。它让 Claude 可以在没有 permission prompt 的情况下直接执行操作但会有一个独立的 classifier 模型在每个动作执行前先过一遍把那些「超出你请求范围」、「指向你没授权的基础设施」、或者「被 Claude 读到的恶意内容驱动」的动作直接拦下来。说人话就是它不是真的放手让 Claude 随便干而是「放手 一只看不见的手在兜底」。想一启动就进 Auto Mode可以在 settings 里把 claudeCode.initialPermissionMode 配成 auto。我研究出了几个挺有意思的细节。第一它会顺便降低 Claude 主动跟你确认问题的次数。也就是说它不光很少问你“能不能做”连“你到底想干啥”都问得少了。不过呢要是你在提示信息里明确说了要确认的地方Claude 还是会停下来的。第二它在开启和关闭的时候会重置你的权限规则。就是那种“允许执行任意代码”这种宽泛的允许规则在开启的时候会自动被丢弃退出 Auto Mode 之后又会恢复。这设计挺实在的就好像是承认 Auto Mode 是个更危险的状态主动把那些大刀阔斧的权限收一收。第三它有熔断机制。文档里写得明明白白的“如果分类器连续 3 次或者累计 20 次阻止某个操作Auto Mode 就会暂停Claude Code 会回到普通确认模式你手动批准一次之后才能再开启”。这两个次数的上限是不能自己设置的。第四它本身可不保证安全。官方明确说了这只是研究预览版还不能用于正式生产。文档建议你用它来运行那些“你大体上信任但又懒得每一步都盯着”的任务可别用它来替代对敏感操作的审查。第五企业用户可以用强制拒绝规则来无条件屏蔽某些操作。普通用户也能告诉分类器你信任哪些代码库、存储桶、域名这样它对内部操作的判断会更准。这一条是文档专门给团队管理员留的办法。我看到这五条的时候心里就一个念头这东西的设计逻辑不是“我相信 Claude”而是“我相信一个比 Claude 谨慎得多的裁判”。这种分层的信任模型挺值得好好琢磨琢磨的。再说 Dynamic Workflows这是把单兵变军团如果说 Auto Mode 是「让一个 Claude 干得更快」那 Dynamic Workflows 就是「让一群 Claude 一起干一件大事」。按照 workflows 文档的说法Dynamic Workflows 也是 research preview而一个动态 workflow 就是一段 JavaScript 脚本由 Claude 写出来然后一个 runtime 在后台跑它调度一大堆 subagent 去干活。关键点来了这段脚本不是预设的模板是 Claude 现场根据你的任务现编的。你描述一个任务Claude 给你写一段编排脚本runtime 在后台执行你的 session 还能继续干别的事不会被卡住。适合什么场景文档列了四个很典型的全是我过去最头疼的那种活。第一codebase-wide 的 bug 扫描。整个仓库几千个文件挨个看有没有某个模式的 bug。第二500 个文件的迁移。一次改几百个 import 路径或者签名。第三需要交叉验证的研究问题。不是一个搜索能搞定的要多个角度查再互相印证。第四需要从几个独立角度起草一个严肃方案。在你下决心之前让几个不同视角的草稿互相 PK。传统 subagent 模式干这些活是「Claude 现场决定下一步派谁」编排逻辑全在 Claude 脑子里没法复用也容易断。Workflow 把这一步从「Claude 的脑子里」搬到了「一段可以读、可以改、可以重跑的代码里」。而且 workflow 还能跑出传统 subagent 跑不出来的质量模式比如让几个独立 agent 互相 adversarial review 对方的结论最后再汇总。这其实就是把学术 peer review 的模式塞进 AI 工作流里。最让我兴奋的是workflow 是有内建质量模式的文档里专门强调了这一点。它能做的不是「多派几个 agent 一起堆」而是让这些 agent 互相挑刺、互相印证从几个角度起草方案再权衡最后给你的不是一个原始结果是一个经过内部对抗验证的结果。这一点对严肃任务太关键了。ultracode 怎么用先解释一下背景Claude Code 有一个 /effort 命令控制推理强度从低到高一般是 low、medium、high、xhigh、max 几档。ultracode 不是单独一档 effort而是文档原话「Ultracode is a Claude Code setting that combines xhigh reasoning effort with automatic workflow orchestration」也就是把 xhigh 推理强度和「自动编排 workflow」打包在一起的一个 setting。怎么开两种方式。第一种在 prompt 里直接用关键词。输入「ultracode: 把 src/routes/ 下每个 API endpoint 都审计一下有没有缺鉴权」这种 promptClaude Code 会把 ultracode 这个词高亮紫色然后直接给你写一段 workflow 脚本而不是按 turn 一句一句来。第二种用 /effort ultracode 全局开。开了之后Claude 自己判断哪些任务值得用 workflow一个简单请求可能自动变成连续好几个 workflow 串起来跑一个理解代码、一个动手改、一个验证改得对不对。每个任务都比低 effort 多花 token、慢一点但质量上一个台阶。我自己的两点冷静思考虽然挺兴奋的但我研究完之后还是想给大家泼点冷水。第一关于 token 消耗。ultracode 是高工作量加上工作流程编排每个任务消耗的 token 可不是普通模式的 1 点几倍而是好几倍呢。文档里原话是“每次请求会消耗更多的 token而且比低工作量水平时花费的时间更长”。要是你订阅的是按使用量付费或者有月度使用上限那用的时候可得悠着点别一上来就把 ultracode 设成默认模式。第二调试的复杂度。当一个工作流程运行失败时你看到的可不是“Claude 说了句错话”而是“这段编排脚本在第几个子代理的哪一步出错了”。调试的步骤变多了。文档里给的建议是用 /workflows 命令通过上下箭头选择按回车键进入进度视图这样就能看到每个代理的提示信息、工具调用情况和结果。虽然有这个功能但熟悉它还得花点时间。写在最后这周 Anthropic 做的那些事儿来来回回其实就是在回答一个问题“AI 编程工具到底能帮人干多少活儿”。Auto Mode 给出的答案是尽量少打扰你。Dynamic Workflows 给出的答案是让一群 AI 一起干活儿。ultracode 给出的答案是尽最大努力把上面这两件事打通。把这三样东西合在一起Claude Code 就不再是那种得你手把手教着用的工具了它更像是一个小型工程团队你只要下达目标它自己就能拆解目标、组织人手还能自己验收结果。这个转变意义可大了从这儿开始AI 编程比拼的就不再是“单兵作战能力”而是“工程组织能力”了。