前言AI 工程范式迎来第四代变革2026 年 6 月Google 工程总监 Addy Osmani 正式提出Loop Engineering循环工程迅速成为 AI Agent、代码自动化领域的核心架构范式。 在此之前AI 工程已经历三代演进Prompt Engineering提示工程打磨单次对话指令人全程手动驱动交互Context Engineering上下文工程整合 RAG、历史记忆、工具信息丰富单次输入上下文Harness Engineering线束 / 驾驭工程为 Agent 搭建沙箱、权限、工具集等静态运行环境Loop Engineering循环工程搭建自治闭环调度系统彻底把人类从 “反复下发提示、校验结果” 的重复劳动中解放。Anthropic Claude Code 负责人 Boris Cherny 一句话点明核心转变我不再手动给 Claude 写提示词。我搭建循环系统由循环自动向模型下发指令、判断下一步动作我的工作只剩设计循环本身。很多开发者会混淆Agent Loop与Loop Engineering二者并非同一概念Agent Loop单个 Agent 底层最小执行单元流程为「推理 Reason→执行 Act→观测 Observe→判断终止」是所有智能体内置的基础逻辑Loop Engineering上层系统工程方法论批量调度、管控无数 Agent Loop配套独立校验、事件触发、持久状态、熔断防护整套体系。 简单比喻Agent Loop 是厨师自带的做菜步骤Loop Engineering 是全自动中央厨房调度流水线。一、Loop Engineering 核心定义标准定义Loop Engineering 是一套面向 LLM Agent 的闭环系统架构方法论开发者仅定义可量化目标、校验规则、终止条件搭建自动调度系统由系统自主完成任务触发、Agent 分发、执行校验、自动纠错、状态持久化全流程无人值守持续迭代直到满足完工标准。核心口号Stop Prompting. Design the Loop.停止手动提示专注设计循环核心本质传统 AI 协作是人作为循环控制器人发 Prompt→看结果→人工修正指令→再次提问 循环工程是系统替代人成为循环控制器人类角色从 “实时操作员” 转变为 “系统架构师、规则定义者”。二、完整循环工程六大核心模块Addy Osmani 标准架构循一套生产级 Loop 系统由 6 个缺一不可的模块组成1. Automations 自动化触发器负责自主唤醒循环无需人工启动主流触发源事件触发Git PR 提交、Issue 新建、CI 构建失败、监控告警、数据库数据变更定时触发Cron 定时任务每日凌晨批量修复 Bug、每周生成项目报告手动兜底触发支持人工一键启动特殊任务。2. Sub-agents 子 Agent 集群循环的执行单元底层复用标准 Agent Loop 完成实际任务多子 Agent 并行隔离执行分工拆分复杂目标区分执行 Agent写代码、爬取数据、评审 Agent语义校验、逻辑审查两类角色每个子 Agent 独立运行原生ReAct循环。3. Worktrees 隔离工作区解决多 Agent 并行冲突的安全机制每个任务分配独立沙箱 / 代码分支Agent 修改文件互不覆盖执行失败可一键销毁隔离环境不污染主项目代码支持多方案并行探索择优合并最终结果。4. Skills 技能库沉淀可复用工具能力避免 Agent 每次从零探索文件读写、单元测试运行、编译构建、接口调用、Git 操作等标准化工具技能持久归档循环每次启动直接复用大幅降低 Token 消耗。5. Connectors 外部连接器打通循环与外部业务系统GitHub、飞书 / 钉钉通知、数据库、监控平台、测试服务 配套权限管控区分只读、可修改、需人工审批三类操作防止越权风险。6. State File 持久状态存储循环的记忆中枢解决长周期任务中断丢失进度问题记录迭代轮次、历史报错、中间产出、任务进度、资源消耗支持中断续跑、日志追溯、异常复盘内置熔断数据最大迭代次数、最大 Token 成本、连续无进展阈值。三、标准执行流程触发唤醒触发器捕获事件初始化循环状态任务分发拆分大目标分配至独立 Worktree 与子 Agent内层执行每个Agent 运行自身 Agent Loop完成产出双层校验硬校验单元测试、编译、Lint 等确定性程序校验软校验专用评审 Agent 核查逻辑、需求匹配度分支决策全部通过归档成果、推送通知循环正常结束校验失败提取报错生成修正指令重新迭代触发熔断达到最大轮次 / 成本阈值留存日志转交人工更新状态保存本轮迭代信息等待下一次触发。四、落地适用场景适合使用 Loop Engineering代码自动化PR 自动审查、批量修复 CI 报错、自动生成测试用例数据流水线定时爬取、清洗校验、异常重跑、自动产出报表自动化运维7×24 指标巡检、故障定位、自动修复复测长文本迭代文献整理、稿件多轮修改直至满足规范。不推荐使用低频一次性任务手动 Prompt 更快产出无量化标准、只能人工主观评判简单单轮问答搭建调度系统收益极低。五、极简 Python Demo区分两层逻辑from dataclasses import dataclass, field import subprocess # 1. 循环持久状态Loop Engineering专属 dataclass class LoopState: goal: str iteration: int 0 max_iter: int 10 errors: list field(default_factorylist) status: str running # 底层单个Agent Loop 执行单元 def agent_loop_fix_code(error: str) - str: # LLM调用逻辑省略输入报错返回修复代码 return 修复后代码片段 # 硬校验层循环工程核心 def run_pytest_check(): res subprocess.run([pytest, -q], capture_outputTrue, textTrue) return {pass: res.returncode 0, msg: res.stdout res.stderr} # 顶层Loop Engineering 调度主循环 def loop_engine_run(goal: str): state LoopState(goalgoal) while state.status running: state.iteration 1 # 熔断判断 if state.iteration state.max_iter: state.status need_human break # 校验当前结果 check run_pytest_check() if check[pass]: state.status success break # 失败则调用Agent Loop重跑 agent_loop_fix_code(check[msg]) state.errors.append(check[msg]) print(f迭代轮次:{state.iteration}, 结果:{state.status}) if __name__ __main__: loop_engine_run(修复所有单元测试用例全部通过)代码分层说明agent_loop_fix_code底层 Agent LoopLoopState、熔断、调度主逻辑Loop Engineering 上层调度体系。运行结果代码中的run_pytest_check()函数运行pytest -q但当前项目没有测试文件所以pytest总是返回失败状态导致循环一直运行直到达到最大迭代次数10次。六、区分Loop Engineering vs 传统工作流感觉“很像工作流”是因为外壳相似触发、编排、分支、状态但内核完全相反。传统工作流 步骤驱动、固定流程、单向执行循环工程 目标驱动、动态自适应、闭环自修正1. 传统工作流Airflow、Dolphin、Flowable、低代码所有步骤开发时写死A→B→C→D失败只会重试当前步骤不会改变执行方案没有智能校验回流流程单向不可逆不需要AI纯脚本即可运行本质流水线按既定工序跑完即可。2. Loop Engineering 循环工程只定义最终目标不定义中间步骤Agent自主规划动作、调整方案、尝试不同思路校验失败错误回流重新迭代优化产出迭代次数、路径完全动态由结果决定本质研发实验室不达验收标准不停止。3. 核心差异对比对比维度传统工作流Loop Engineering驱动逻辑步骤驱动静态固定目标驱动动态自适应失败处理简单重试或终止无优化能力错误回流、策略迭代、自我修正执行单元脚本、API、固定任务具备推理规划能力的Agent Loop闭环能力单向流程无自我优化闭环执行-校验-修正 内生自治闭环七、 极简上手终端/AI工具快速使用主流AI编码工具Claude Code等原生支持循环工程能力无需复杂部署一键启用开启定时循环/loop 5m 自动化检查项目代码规范、修复简易报错固定周期持续巡检迭代开启目标自治循环直接下发量化Goal例如/goal 将项目单元测试覆盖率提升至80%最大迭代10轮系统自动循环优化直至达标终止循环无需等待结束手动兜底指令/goal clear一键停止当前所有循环任务。感兴趣的宝子可以关注一波后续会更新更多有用的知识
一文彻底搞懂 Loop Engineering
发布时间:2026/6/26 1:04:36
前言AI 工程范式迎来第四代变革2026 年 6 月Google 工程总监 Addy Osmani 正式提出Loop Engineering循环工程迅速成为 AI Agent、代码自动化领域的核心架构范式。 在此之前AI 工程已经历三代演进Prompt Engineering提示工程打磨单次对话指令人全程手动驱动交互Context Engineering上下文工程整合 RAG、历史记忆、工具信息丰富单次输入上下文Harness Engineering线束 / 驾驭工程为 Agent 搭建沙箱、权限、工具集等静态运行环境Loop Engineering循环工程搭建自治闭环调度系统彻底把人类从 “反复下发提示、校验结果” 的重复劳动中解放。Anthropic Claude Code 负责人 Boris Cherny 一句话点明核心转变我不再手动给 Claude 写提示词。我搭建循环系统由循环自动向模型下发指令、判断下一步动作我的工作只剩设计循环本身。很多开发者会混淆Agent Loop与Loop Engineering二者并非同一概念Agent Loop单个 Agent 底层最小执行单元流程为「推理 Reason→执行 Act→观测 Observe→判断终止」是所有智能体内置的基础逻辑Loop Engineering上层系统工程方法论批量调度、管控无数 Agent Loop配套独立校验、事件触发、持久状态、熔断防护整套体系。 简单比喻Agent Loop 是厨师自带的做菜步骤Loop Engineering 是全自动中央厨房调度流水线。一、Loop Engineering 核心定义标准定义Loop Engineering 是一套面向 LLM Agent 的闭环系统架构方法论开发者仅定义可量化目标、校验规则、终止条件搭建自动调度系统由系统自主完成任务触发、Agent 分发、执行校验、自动纠错、状态持久化全流程无人值守持续迭代直到满足完工标准。核心口号Stop Prompting. Design the Loop.停止手动提示专注设计循环核心本质传统 AI 协作是人作为循环控制器人发 Prompt→看结果→人工修正指令→再次提问 循环工程是系统替代人成为循环控制器人类角色从 “实时操作员” 转变为 “系统架构师、规则定义者”。二、完整循环工程六大核心模块Addy Osmani 标准架构循一套生产级 Loop 系统由 6 个缺一不可的模块组成1. Automations 自动化触发器负责自主唤醒循环无需人工启动主流触发源事件触发Git PR 提交、Issue 新建、CI 构建失败、监控告警、数据库数据变更定时触发Cron 定时任务每日凌晨批量修复 Bug、每周生成项目报告手动兜底触发支持人工一键启动特殊任务。2. Sub-agents 子 Agent 集群循环的执行单元底层复用标准 Agent Loop 完成实际任务多子 Agent 并行隔离执行分工拆分复杂目标区分执行 Agent写代码、爬取数据、评审 Agent语义校验、逻辑审查两类角色每个子 Agent 独立运行原生ReAct循环。3. Worktrees 隔离工作区解决多 Agent 并行冲突的安全机制每个任务分配独立沙箱 / 代码分支Agent 修改文件互不覆盖执行失败可一键销毁隔离环境不污染主项目代码支持多方案并行探索择优合并最终结果。4. Skills 技能库沉淀可复用工具能力避免 Agent 每次从零探索文件读写、单元测试运行、编译构建、接口调用、Git 操作等标准化工具技能持久归档循环每次启动直接复用大幅降低 Token 消耗。5. Connectors 外部连接器打通循环与外部业务系统GitHub、飞书 / 钉钉通知、数据库、监控平台、测试服务 配套权限管控区分只读、可修改、需人工审批三类操作防止越权风险。6. State File 持久状态存储循环的记忆中枢解决长周期任务中断丢失进度问题记录迭代轮次、历史报错、中间产出、任务进度、资源消耗支持中断续跑、日志追溯、异常复盘内置熔断数据最大迭代次数、最大 Token 成本、连续无进展阈值。三、标准执行流程触发唤醒触发器捕获事件初始化循环状态任务分发拆分大目标分配至独立 Worktree 与子 Agent内层执行每个Agent 运行自身 Agent Loop完成产出双层校验硬校验单元测试、编译、Lint 等确定性程序校验软校验专用评审 Agent 核查逻辑、需求匹配度分支决策全部通过归档成果、推送通知循环正常结束校验失败提取报错生成修正指令重新迭代触发熔断达到最大轮次 / 成本阈值留存日志转交人工更新状态保存本轮迭代信息等待下一次触发。四、落地适用场景适合使用 Loop Engineering代码自动化PR 自动审查、批量修复 CI 报错、自动生成测试用例数据流水线定时爬取、清洗校验、异常重跑、自动产出报表自动化运维7×24 指标巡检、故障定位、自动修复复测长文本迭代文献整理、稿件多轮修改直至满足规范。不推荐使用低频一次性任务手动 Prompt 更快产出无量化标准、只能人工主观评判简单单轮问答搭建调度系统收益极低。五、极简 Python Demo区分两层逻辑from dataclasses import dataclass, field import subprocess # 1. 循环持久状态Loop Engineering专属 dataclass class LoopState: goal: str iteration: int 0 max_iter: int 10 errors: list field(default_factorylist) status: str running # 底层单个Agent Loop 执行单元 def agent_loop_fix_code(error: str) - str: # LLM调用逻辑省略输入报错返回修复代码 return 修复后代码片段 # 硬校验层循环工程核心 def run_pytest_check(): res subprocess.run([pytest, -q], capture_outputTrue, textTrue) return {pass: res.returncode 0, msg: res.stdout res.stderr} # 顶层Loop Engineering 调度主循环 def loop_engine_run(goal: str): state LoopState(goalgoal) while state.status running: state.iteration 1 # 熔断判断 if state.iteration state.max_iter: state.status need_human break # 校验当前结果 check run_pytest_check() if check[pass]: state.status success break # 失败则调用Agent Loop重跑 agent_loop_fix_code(check[msg]) state.errors.append(check[msg]) print(f迭代轮次:{state.iteration}, 结果:{state.status}) if __name__ __main__: loop_engine_run(修复所有单元测试用例全部通过)代码分层说明agent_loop_fix_code底层 Agent LoopLoopState、熔断、调度主逻辑Loop Engineering 上层调度体系。运行结果代码中的run_pytest_check()函数运行pytest -q但当前项目没有测试文件所以pytest总是返回失败状态导致循环一直运行直到达到最大迭代次数10次。六、区分Loop Engineering vs 传统工作流感觉“很像工作流”是因为外壳相似触发、编排、分支、状态但内核完全相反。传统工作流 步骤驱动、固定流程、单向执行循环工程 目标驱动、动态自适应、闭环自修正1. 传统工作流Airflow、Dolphin、Flowable、低代码所有步骤开发时写死A→B→C→D失败只会重试当前步骤不会改变执行方案没有智能校验回流流程单向不可逆不需要AI纯脚本即可运行本质流水线按既定工序跑完即可。2. Loop Engineering 循环工程只定义最终目标不定义中间步骤Agent自主规划动作、调整方案、尝试不同思路校验失败错误回流重新迭代优化产出迭代次数、路径完全动态由结果决定本质研发实验室不达验收标准不停止。3. 核心差异对比对比维度传统工作流Loop Engineering驱动逻辑步骤驱动静态固定目标驱动动态自适应失败处理简单重试或终止无优化能力错误回流、策略迭代、自我修正执行单元脚本、API、固定任务具备推理规划能力的Agent Loop闭环能力单向流程无自我优化闭环执行-校验-修正 内生自治闭环七、 极简上手终端/AI工具快速使用主流AI编码工具Claude Code等原生支持循环工程能力无需复杂部署一键启用开启定时循环/loop 5m 自动化检查项目代码规范、修复简易报错固定周期持续巡检迭代开启目标自治循环直接下发量化Goal例如/goal 将项目单元测试覆盖率提升至80%最大迭代10轮系统自动循环优化直至达标终止循环无需等待结束手动兜底指令/goal clear一键停止当前所有循环任务。感兴趣的宝子可以关注一波后续会更新更多有用的知识