Loop Engineering（Agent 闭环工程）

发布时间：2026/6/14 5:19:28

Loop Engineering闭环工程的本质是将你从手动投喂 Prompt 的人体 API这一角色中彻底剔除。你转而设计一套能自动驱动工作流运转的底层系统。此处的闭环Loop可理解为一种递归式目标你只需定义终态AI 便会持续迭代直至收敛。它底层由 5 大核心组件构成而 Claude Code 和 Codex 目前均已点亮这五块技能树。毫无疑问这大概率是我们未来与 Coding Agent 协同的终极形态。尽管处于极早期我们需要保持克制——尤其是你必须对 Token 燃烧率Burn Rate保持高度敏锐Token 自由与 Token 拮据对应的工程模式天差地别。你依然需要引入质量卡口来防止代码劣化业界对于AI 生成垃圾代码Slop的担忧绝非杞人忧天。即便如此我们仍值得去进行深度剖析Drill-down。steipete[2] 近期断言[3]你绝不该再手动给 Coding Agent 写 Prompt 了。你应该设计一套闭环让系统自动去 Prompt 你的 Agent。无独有偶Anthropic 的 Claude Code 负责人 bcherny[4] 也表态[5]“我已彻底摒弃手动 Prompt Claude。我正在运行一些闭环由它们去自动 Prompt Claude 并调度下一步决策。我现在的核心工作就是编排闭环Writing loops。”所以这套理念到底意味着什么过去两年你想从 Coding Agent 那里榨取价值标准动作是手搓极其考究的 Prompt喂足上下文。你敲一段指令读回复再敲下一段。Agent 只是个工具而你始终被死死绑定在执行回路上Human-in-the-loop一轮一轮死磕。这种低效模式正在消亡或者至少先锋开发者们认为它正在走向终结。现在你是在架构一个微型系统让它自己找活、分发任务、校验交付物、落盘进度然后自主决断Route下一步行动。你让这套系统去驱动Agent而不是你亲自下场。我之前布道过它的前置形态——Agent Harness Engineering智能体底座工程[6]即打造包裹单 Agent 运行的沙盒环境以及 Factory Model工厂模式[7]——构建软件的流水线基建。Loop Engineering 就架设在 Harness 这一层之上。它本质也是一个底层框架但被挂载了定时器Timer能自动拉起Spawn子助手并且实现了实现上下文自驱的迭代闭环。令人震撼的是这已然跨越了工具层面。一年前想要跑通一个闭环你得手撸一堆 Bash 脚本且必须承担这堆私有祖传代码的终身维护成本。如今这些基座能力已原生内置于产品中。Steinberger 梳理的清单不仅与 Codex 严丝合缝在 Claude Code 上也实现了像素级对齐。一旦你看透两者底层架构的同构性便无需再陷入工具选型之争。你只需专注设计一套工具无关Tool-agnostic的通用闭环无论挂载在哪个底座上都能无缝运转。5 大核心组件外挂记忆层Memory一个高优闭环[8]必备 5 个核心组件外加一个状态持久化State Persistence容器。我们先做全盘枚举再逐一映射。Automations自动化机制按调度节奏运转、自主完成异常发现与问题分流Triage。Worktrees工作树物理隔离并行环境斩断多 Agent 并发时的相互踩踏。Skills技能包沉淀私有项目上下文拒绝让 Agent 靠盲猜写代码。Plugins Connectors插件与连接器让 Agent 将触角深入你现存的业务主流程工具链。Sub-agents子智能体在架构上彻底解耦出方案的执行者Maker“与做校验的审查者Checker”。然后是第六大核心Memory记忆层。一个 Markdown 进度文件或一块 Linear 看板——任何游离于单次会话之外、能持久化已完成什么与待办是什么的存储介质。这听起来平淡无奇。但正如我在长周期 Agent[9]里拆解的这是所有长生命周期智能体赖以生存的底座技巧大模型在两次运行之间会清空所有状态所以记忆必须落盘Disk-backed绝不能塞在上下文里。智能体会遗忘但代码库不会。目前这两大产品均已原生集齐这 5 块拼图。命名策略可能略有差异但底层能力完全对等。我们需要逐个 Drill-down因为坦白讲工程细节决定了一个闭环是严丝合缝还是到处内存泄漏Leakage。Automations自动化机制闭环的心跳Automations 是让一个 Loop 成为真正闭环而非一次性跑批任务的灵魂。在 Codex 应用中你在 Automations 面板进行编排挂载项目、注入它要跑的 Prompt、配置调度频率并设定它是跑在你的本地工作区Checkout还是后台 Worktree 里。发现 Issue 的运行会自动流转至问题分流收件箱Triage inbox而未捕捉到异常的运行则自动归档体验极佳。OpenAI 内部用它们来吃掉枯燥的基建杂活比如每日 Issue 分流、聚类 CI 报错、自动生成 Commit 简报、甚至追溯上周某人引入的 Bug 源头。更强的是Automations 可以直接拉起 Skill从而保障高频任务的长期可维护性只需触发skill-name而不是在没人维护的定时任务里硬编码一坨如山般的长文本 Prompt。Claude Code 依靠调度Scheduling与钩子Hooks打通了相同的逻辑。你可以用/loop挂载定时 Prompt 或命令跑 Cron 任务利用 Hooks 在 Agent 生命周期的特定节点拉起 Shell 命令或是干脆将整个工作流推入 GitHub Actions实现关上笔记本后的离线托管。其底层思路如出一辙定义一个自主任务注入节拍让结果自动推送到你面前杜绝人肉轮询。此外还有一个必须提及的 Session 级原语in-session primitive它直击本文核心。/loop侧重于按固定节拍重跑而/goal则是持续运转死磕直到你预设的条件绝对成立。每次迭代Iteration后系统会拉起一个全新的模型实例来做验收校验——彻底掐断写代码的模型既当裁判又当选手的作弊可能。你可以下达这样的指令“确保 test/auth 目录下的测试全绿且 Lint 零警告”然后就能放心切出去喝咖啡。Codex 也实装了同名原语/goal支持跨多轮运转直至可验证的终止条件触发并支持暂停与恢复。同一个原语双端通用这也几乎贯穿了全文的主线逻辑。所以这个模块专攻发现需求。闭环的后续模块专攻干掉需求。Worktrees工作树斩断并发时的互相踩踏只要你的并发 Agent 数量大于一文件读写冲突就是必然的灾难点。两个 Agent 强行修改同一文件和两个碳基工程师没有对齐就向同一块代码提交 PR 是一样的痛点。git worktree是完美的解法它提供独立的工作目录挂载在独立分支上却共享同一份代码的历史树。这从物理层面掐断了一个 Agent 污染另一个 Agent 工作区的可能性。Codex 在底层原生融合了 Worktree 机制多线程Threads并发打向同一个 Repo 也绝对不会互踩。Claude Code 同样提供了极致的隔离借助git worktree、--worktree标志位在独立的隔离区中启动会话你还可以为子智能体打上isolation: worktree标签确保每个助手被拉起时都获得一个纯净且用后即焚的沙盒。我在编排税The Orchestration Tax[10]一文中探讨过这背后的人效博弈Worktree 虽然抹平了机器层面的物理碰撞但你个人的心智带宽依旧是系统的瓶颈。你能 Review 多少代码决定了并发量的上限而非工具的 QPS。Skills技能包拒绝冷启动时的上下文复读Skill 的存在是为了让你不用像金鱼一样在每次新 Session 开启时都要向模型复述项目的上下文。两款工具遵循同样的工程范式建立一个包含SKILL.md的目录内部封装指令与元数据并可外挂脚本、参考文档与静态资源。在 Codex 中敲击$或/skills即可唤起甚至当任务命中 Skill 描述时会隐式触发——这也是为什么一段克制且严谨的描述永远秒杀抖机灵的 Prompt。Claude Code 采用了像素级一致的机制我在Agent Skills[11]里详细拆解过该模式。Skill 也是终结你反复为意图Intent“买单的破局点。正如我在意图债The Intent Debt[12]中的推演Agent 的每次运行都是纯粹的冷启动它会用迷之自信的幻觉猜测填补你意图里的任何空洞。Skill 本质就是意图的固化”代码规约、构建链路、“上次引发线上事故后绝对禁止的写法”——这些血泪教训只需沉淀一次Agent 每次拉起都会自动加载。没有 Skill闭环每次都在徒手推演你的项目逻辑有了 Skill它才能产生复利。有一点必须厘清Skill 是编写格式而 Plugin 是分发渠道。当你需要跨 Repo 共享 Skill或者将一组高内聚的 Skill 打包时你就将其封装为 Plugin。Codex 如此Claude Code 亦然。Plugins Connectors插件与连接器让闭环打通真实工具链一个只能在本地文件系统里打转的闭环充其量是个玩具。连接器基于 MCP 协议构建让 Agent 真正长出了触角去读取 Issue 追踪看板、直连数据库捞数据、调取 Staging 环境 API、或是向 Slack 频道推送告警。Codex 与 Claude Code 均深度支持 MCP这意味着你为其中一端手搓的连接器通常能直接在另一端无缝运行。而 Plugin 则将 Connector 与 Skill 打包在一起让你的团队可以一键拉取你的配置而不是靠记忆重新搭环境。这就是Agent 嘴上说’这是修复方案’“与系统自己拉起 PR、自动关联 Linear Ticket、并在 CI 爆绿后自动 Ping 业务群之间的绝对降维打击。连接器赋予了闭环在你真实线上环境里执行动作Act的权限而不再是抛出理论可行方案”。Sub-agents子智能体架构上的 Maker/Checker 解耦闭环中最具威力的架构设计绝对是将写代码Maker和审代码Checker的智能体进行硬解耦。让模型对自己的产出物打分无异于监守自盗。引入第二个被注入了不同指令甚至搭载不同底层模型的 Agent能精准狙击第一个 Agent自圆其说的漏洞。Codex 仅在显式请求时才会拉起Spawn子智能体它们并行运算随后将结果折叠Fold进最终答复。你在.codex/agents/下用 TOML 文件声明专属 Agent定义名称、职责边界及可选的模型与推理阈值。因此你的安全审查官可以是一头挂载了高强度推理模型的巨兽而探索者则是一个疾速的只读轻量模型。Claude Code 也在.claude/agents/与 Agent Teams 下实装了同样的架构并支持上下文流转。大厂当前的常规拆分是一个专攻探索一个负责落地一个对齐 PRD 严格校验。我曾在代码智能体乐团[13]与对抗式代码审查Adversarial Code Review[14]中两度重申该理念。这种拆分在闭环中极其致命因为闭环是在你挂机Unattended状态下运转的。一个经得起拷问的 Verifier是你敢切出去喝咖啡的唯一护城河。子智能体的代价是激增的 Token 消耗量因为每次拉起都在跑独立的模型与 Tool-call好钢必须用在刀刃上只在值得花钱买 Second Opinion的关键链路投入。这实际上也就是 Claude Code 的/goal底层在做的事由一个隔离的全新模型实例来宣判闭环是否终止绝不让干活的模型自己喊停。Maker 与 Checker 的解耦被原生固化在了终止条件里。一个高阶业务闭环Full Loop长什么样将上述组件拼接单点对话就会跃升为一个微型控制中枢Control Panel。这是我高频复用的一套实战拓扑每天清晨一个 Automation 挂载在主 Repo 上按时拉起。它的 Prompt 会唤醒一个分流 Skill拉取昨晚 CI 的飘红日志、Open Issues 及最新 Commits并将汇总态写入 Markdown 文件或 Linear 看板。面对每一个值得跟进的异常该链路会自动开辟一个物理隔离的 Worktree拉起一个子智能体去起草修复方案Draft fix紧接着拉起第二个子智能体拿着项目的私有 Skill 和存量测试用例对其进行暴力 Review。连接器赋予闭环自动提 PR、流转 Ticket 的权限。任何超纲的 Edge Case 会被捕获并回退至我的分流收件箱中。状态持久化文件则是整条流水线的骨干Backbone它锁死了哪些方案试过、哪些测试 Pass、哪些点依然 Open。明早的自动化链路会精准对齐今天的断点继续跑。复盘一下你的实际投入你只在架构期做了一次设计。你没有为其中任何一个执行动作写过一句手动 Prompt。这正是 Steinberger 观点的硬核落地无论是在 Codex 还是 Claude Code 中这套闭环跑得同样丝滑因为底层基建高度同源。闭环依然无法替你兜底的坑闭环重塑了研发流但绝对没有把你从链路中删掉。甚至随着闭环愈发强大有三个系统性风险会变得极度尖锐而非缓解。代码问责Accountability永远在你。一个无人值守运转的闭环同样具备无人值守搞砸一切的破坏力。你强行解耦审查者与执行者唯一目的是让闭环输出的LGTM搞定了稍微有点含金量。但这充其量只是一句系统声明绝非数学定理。我依然要复述 AI 时代的代码审查[15]里的那条铁律你的核心工作是交付你本人亲自 Verify 且敢于兜底的代码。警惕理解力剥离。闭环帮你 Delivery 的速度越快产出的代码与你大脑中真实掌控的逻辑之间的鸿沟就越深。这便是理解债Comprehension Debt[16]。一条异常顺滑的闭环只会让这笔技术债呈几何级膨胀——除非你强迫自己去读它吐出的逻辑。警惕认知让渡Cognitive Surrender。当系统全自动运转时人类的天性会诱发你放弃判断力直接 Merge 它扔给你的任何东西。带着敬畏心去架构闭环它是提效的解药为了逃避动脑去滥用闭环它就是崩溃的催化剂。动作相同因果倒置。去架构你的闭环。但务必坚守极客底色毫无疑问这是我们研发生态演变的一次预演。话虽如此如果我彻底放弃亲身 Review或者盲目依赖自动化 Loop 去修 Bug我的产品质量迟早会崩盘。我大概率会陷入越填坑越深的向下螺旋。放手去搭你的 Loop。但也别忘了直接用 Prompt 驱动 Agent 在某些场景下依然高效。真正的工程素养在于寻找那个精妙的平衡点。同样的 Loop 引擎交由不同人调度结局大相径庭。有人用它去加杠杆打穿自己具备极高认知的领域有人用它去逃避理解工作本身。Loop 引擎不关心这其中的区别。但你必须心知肚明。正因如此架构一套闭环远比手写 Prompt 困难得多而非更简单。Cherny 的潜台词并不是研发变简单了而是工程杠杆的支点已经彻底转移了。构建闭环。但请以一个打算继续掌控系统的工程师的姿态去构建而不是沦为一个只会无脑按下Start键的按键机器。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

免费风扇控制软件FanControl：3步打造完美静音电脑系统

免费风扇控制软件FanControl：3步打造完美静音电脑系统【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa…

2026/6/14 5:19:08 阅读更多

从游戏帧率到AI炼丹：FP32和FP64精度选择背后的性能与成本权衡

从游戏帧率到AI炼丹：FP32和FP64精度选择背后的性能与成本权衡当你在《赛博朋克2077》中调整画质选项时，是否想过"超高精度"选项背后是显卡在每秒进行数万亿次FP32计算？而当科学家模拟黑洞碰撞时，为什么必须使用FP64精度…

2026/6/14 5:16:05 阅读更多

终极Windows鼠标自动化神器：AutoClicker让你的工作效率提升10倍

终极Windows鼠标自动化神器：AutoClicker让你的工作效率提升10倍【免费下载链接】AutoClicker AutoClicker is a useful simple tool for automating mouse clicks. 项目地址: https://gitcode.com/gh_mirrors/au/AutoClicker 你是否厌倦了每天重复点击鼠标的…

2026/6/14 5:15:25 阅读更多

OpenSpeedy：基于Windows API Hook的开源游戏变速器技术深度解析

OpenSpeedy：基于Windows API Hook的开源游戏变速器技术深度解析【免费下载链接】OpenSpeedy 🎮 An open-source game speed modifier. 项目地址: https://gitcode.com/gh_mirrors/op/OpenSpeedy OpenSpeedy是一款采用Ring3层Hook技术的开源游戏变…

2026/6/14 6:36:13 阅读更多

手机摄像头背后的‘高速公路’：深入浅出聊聊MIPI CSI-2的CPHY与DPHY到底怎么选？

手机摄像头背后的‘高速公路’：深入浅出聊聊MIPI CSI-2的CPHY与DPHY到底怎么选？在智能手机和IoT设备的设计中，摄像头模组的数据传输效率直接影响成像质量和系统功耗。MIPI CSI-2作为行业标准接口，其物理层协议CPHY与DPHY的选择往往…

2026/6/14 6:36:13 阅读更多

STM32CubeIDE避坑指南：手把手教你搞定正点原子精英板LCD驱动（附完整代码）

STM32CubeIDE避坑指南：手把手教你搞定正点原子精英板LCD驱动（附完整代码） 移植LCD驱动是嵌入式开发中常见的任务，但过程中往往会遇到各种"坑"。本文将针对正点原子精英板（F103）在STM32CubeIDE环…

2026/6/14 6:35:12 阅读更多

终极指南：用BetterNCM插件管理器解锁网易云音乐隐藏功能

终极指南：用BetterNCM插件管理器解锁网易云音乐隐藏功能【免费下载链接】BetterNCM-Installer 一键安装 Better 系软件项目地址: https://gitcode.com/gh_mirrors/be/BetterNCM-Installer 你是否觉得网易云音乐PC版的界面和功能有些单调？Better…

2026/6/14 6:33:10 阅读更多

从Coda到博海深衡：国产三维成像声纳实战选型指南（附DASS710对比）

从Coda到博海深衡：国产三维成像声纳实战选型指南水下三维成像声纳技术正经历从进口垄断到国产突破的关键转折期。去年某海洋工程公司在南海油气平台巡检项目中，首次采用国产设备完成原本依赖进口声纳的水下结构物检测任务，不仅将单次作业成本…

2026/6/14 6:33:10 阅读更多

手把手教你用阿里云ECS、AWS EC2和GCP Compute Engine搭建同款Web应用：成本、性能与配置体验全对比

三大云平台实战评测：从零搭建Web应用的成本与性能全解析云计算已经成为现代应用开发的基础设施，但对于开发者而言，面对阿里云、AWS和GCP这三大平台时，如何选择最适合自己项目的那一个？本文将通过一个真实的Web应用部署…

2026/6/14 6:31:09 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

音乐文件解锁实战指南：3个场景解决你的播放困境【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://git…

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

遥感卫星数据选型实战指南：从参数解析到场景化应用当面对GEE、PIE-Engine等云平台上数十种遥感数据源时，许多研究者常陷入选择困难——Landsat的历史连续性、Sentinel-2的红边波段优势、高分系列的亚米级分辨率各有千秋。本文将打破常规参数罗列式对比&a…

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

1. 项目概述：MC68302 AutoBaud技术深度解析在嵌入式系统开发，尤其是那些需要与外部设备进行串口通信的场景里，最让人头疼的环节之一就是波特率匹配。想象一下，你设计了一个数据采集终端，需要连接来自不同厂家、不同年代…

2026/6/14 0:01:11 阅读更多

音乐文件解锁实战指南：3个场景解决你的播放困境

2026/6/14 0:00:09 阅读更多

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

2026/6/14 0:00:30 阅读更多

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

2026/6/14 0:01:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/13 10:27:28 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/13 10:01:44 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/13 10:00:44 阅读更多

相关文章

免费风扇控制软件FanControl：3步打造完美静音电脑系统

从游戏帧率到AI炼丹：FP32和FP64精度选择背后的性能与成本权衡

终极Windows鼠标自动化神器：AutoClicker让你的工作效率提升10倍

OpenSpeedy：基于Windows API Hook的开源游戏变速器技术深度解析

手机摄像头背后的‘高速公路’：深入浅出聊聊MIPI CSI-2的CPHY与DPHY到底怎么选？

STM32CubeIDE避坑指南：手把手教你搞定正点原子精英板LCD驱动（附完整代码）

终极指南：用BetterNCM插件管理器解锁网易云音乐隐藏功能

从Coda到博海深衡：国产三维成像声纳实战选型指南（附DASS710对比）

手把手教你用阿里云ECS、AWS EC2和GCP Compute Engine搭建同款Web应用：成本、性能与配置体验全对比

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

音乐文件解锁实战指南：3个场景解决你的播放困境

从Landsat到高分系列：手把手教你选择适合自己项目的遥感卫星数据

MC68302 AutoBaud技术：硬件级串口波特率自动检测原理与实现

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因