AI工程新范式：一篇搞懂Harness Engineering——是什么/怎么学/用什么工具/怎么落地

发布时间：2026/5/27 5:35:29

AI工程新范式一篇搞懂Harness Engineering——是什么/怎么学/用什么工具/怎么落地最近刷AI圈博客一定会看到Harness Engineering这个新名词OpenAI、Anthropic这些顶级AI团队都在聊各路技术博主也纷纷发文解读。很多朋友看了一圈还是懵不就是个新名词包装老东西吗到底解决了什么实际问题今天就用通俗易懂的方式把Harness Engineering讲明白它是什么、核心要解决什么问题新手该怎么学目前有什么好用的工具再结合真实实践案例给大家参考。一、先搞懂到底什么是Harness Engineering用一个比喻讲清楚你一定试过让AI写代码刚用的时候惊为天人怎么能这么准但真要做一个完整项目用不了几天就会发现问题聊着聊着AI就忘了你之前说的要求本来要求单文件不超200行转头就给你写了1000行的大杂烩改一个bugAI顺便给你改出三个新bug最后项目直接跑不起来代码变成了一堆逻辑混乱的屎山你让AI按项目架构做结果它偏要乱改核心依赖最后整个项目依赖全乱了这就好比你牵了一匹千里马它跑得快、力气大但是野性难驯想去哪就去哪不仅到不了目的地还可能把车翻到沟里。那怎么办给它配缰绳、马鞍、护栏、路标啊Harness直译就是「马具/挽具」Harness Engineering我们一般叫「驾驭工程」本质就是给AI智能体做一套完整的驾驭系统你负责定方向、画边界AI负责具体干活让能力强但不稳定的大模型变成能稳定干活的生产工具。一句话总结核心公式AI Agent LLM大模型 Harness驾驭系统Harness不生成内容只负责管方向、管边界、管安全、管纠错、管稳定输出。它和我们之前聊的提示词工程、上下文工程有啥区别很多朋友会混淆这几个概念放一张对比表就清晰了工程类型核心解决问题类比场景范围提示词工程怎么让AI听懂你说的话口头命令右转单轮对话指令设计上下文工程给AI看什么信息地图路标管理给大模型的信息Harness Engineering怎么防止AI跑偏/出问题出了怎么修缰绳护栏定期修路整个AI运行的系统架构简单说Harness Engineering就是在上下文工程基础上往前走了一步不光要给AI对的信息还要给它配工具、定规则、建反馈出了问题让它自己改保证AI能从头到尾干完一件完整的事不会半路跑偏。二、核心痛点为什么现在需要Harness EngineeringAI做Demo效果都很惊艳但一到生产环境就拉胯本质是几个绕不开的问题概率性出错大模型是概率输出同样的prompt两次输出可能完全不一样幻觉、越权、格式错误防不胜防无法长期稳定长周期任务做着做着就忘了之前的规则重复踩同一个坑安全不可控AI随便调用工具、越权修改核心代码出问题找不到根因也没法审计规模化难靠人工一个个改AI输出根本没法做大项目OpenAI去年做了一个实验一个3人的小团队靠Harness Engineering引导AI5个月从零写出了百万行生产级代码全程零人工手写代码效率是传统开发的10倍。这个结果出来之后整个行业才意识到AI工程化的下一站就是Harness。三、新手怎么学Harness Engineering学习路线整理好了很多朋友说概念听懂了但是不知道从哪下手给大家整理了一个循序渐进的学习路线适合新手入门第一步先搞懂核心概念建立底层认知1-2周不用上来就堆代码先把核心逻辑理清楚先读Anthropic的两篇原创文章《Effective Harnesses for Long-Running Agents》《Harness Design for Long-Running Apps》这是整个领域的基础讲清楚了长期运行Agent的设计原则再读OpenAI的博客看他们怎么用Harness做到零人工写代码出百万行项目理解人和AI的分工到底怎么分记住核心分工原则人类做架构设计、规则制定、质量管控AI做具体执行别搞反了第二步从简单项目练手先跑通最小闭环2-3周不用一开始就搞复杂的多智能体系统从个人小项目开始练手先从Level 1开始给你的项目加一个AGENTS.md规则文件把项目架构、开发规范、禁止行为写清楚让AI每次开工前先读这个文件然后加最基础的约束比如要求单文件不超过200行、修改代码必须过单元测试、不许乱改核心依赖先把最容易犯的低级错误挡住再加最基础的反馈闭环AI写完代码自动跑单元测试不通过就让它自己改不用你每次手动检查第三步逐步升级迭代你的驾驭系统当你能跑通小项目之后可以慢慢往里面加能力专业化分工把任务拆给不同的AI Agent比如研究Agent只负责看代码找逻辑规划Agent只负责拆任务执行Agent只负责写代码审查Agent只负责找bug每个Agent只带自己需要的上下文不会信息过载分层上下文把上下文分成三层会话常驻项目结构每次都加载、按需加载特定模块知识用到再加载、持久化知识库历史文档需要的时候再查解决上下文溢出的问题监控与自愈加上日志、错误追踪AI出错之后自动记录错误规则下次就不会再犯同样的错学习的几个小提醒不用重新造轮子很多基础能力现有框架已经做好了直接用就行先学会用再理解原理从小项目做起一开始就搞复杂系统很容易懵跑通最小闭环比什么都重要多踩坑Harness是工程实践不是理论多试你就知道哪些规则好用哪些容易被AI绕过四、目前有哪些好用的工具/框架目前Harness生态还在快速发展给大家整理了常用的工具按场景分好类1. 基础编排框架用来搭自己的HarnessLangGraph目前最火的Agent编排框架支持状态管理、多Agent调度很多团队都基于它做自定义HarnessCrewAI天生支持多Agent角色分工适合做专业化分工的Harness配置简单新手容易上手AutoGPT老牌自主Agent框架自带基础的工具调用和循环执行能力可以快速搭一个最小Harness原型2. 现成的Harness产品/解决方案Harness.ioCI/CD领域的老玩家现在已经推出了AI驱动的开发流水线Harness适合企业直接用不用自己搭Kore.ai Agent Harness面向企业级对话Agent的现成Harness自带权限管理、审计、错误恢复能力Anthropic Claude Code官方已经集成了基础的Harness能力支持AGENTS.md规则适合个人开发者做项目3. 工程实践配套工具校验工具ESLint代码规范、单元测试框架Jest/Pytest、安全扫描工具Snyk这些都是Harness校验层的核心组成基础设施Docker沙箱做运行时隔离防止AI乱改环境、Git做版本控制方便回滚、CI/CD流水线自动跑校验上下文管理向量数据库存持久化知识库、RAG框架LlamaIndex/LangChain做按需检索五、实践案例我们团队是怎么用Harness做项目的最后给大家分享一个我们团队的真实实践大家可以参考我们上个月做了一个内部工具项目整体流程是这样的1. 人类做的工作只花了2天写好AGENTS.md定义项目整体架构前后端分层规则代码规范禁止行为清单比如禁止前端直接连数据库、必须走接口层搭建上下文分层项目结构常驻加载每个模块的领域知识做成分层文档按需加载配置Harness组件加了ESLint校验、单元测试校验、Docker沙箱运行环境定义了反馈闭环规则不通过校验自动重试修正三次不过就报警给人工拆分Agent角色规划Agent拆需求执行Agent写代码审查Agent做代码检查调试Agent改bug2. AI做的工作全程3周人工只介入了5次规划Agent把整体需求拆成了12个迭代任务每个任务拆成小步骤执行Agent按步骤写代码写完自动跑ESLint和单元测试审查Agent检查代码是否符合架构规范有没有越权修改有问题自动交给调试Agent修改没问题就自动提交PR我们只需要最后审核PR合入主干最终结果整个项目一共1.2万行代码全程AI生成我们只改了2处架构决策问题代码质量和我们自己写的没差开发效率比之前快了差不多4倍。当然也踩了坑一开始我们写的规则太模糊AI经常绕过规则后来把规则改成了一条条可校验的硬约束比如单文件超过200行ESLint直接报错不通过不许提交问题就解决了——Harness的核心就是把模糊的要求变成明确可执行的规则让AI没法偷懒绕过去。六、总结Harness Engineering不是什么玄乎的新概念它是AI工程化发展的必然结果从提示词工程优化单轮对话到上下文工程管理信息再到Harness Engineering管理整个AI运行的全流程本质就是一步步让AI从演示品变成真正能用的生产工具。核心记住这几点就够了模型是千里马Harness就是让它按你路线跑的马具人和AI分工人类定架构、定规则AI做执行入门很简单从加一个AGENTS.md开始一步步迭代不用上来就搞复杂系统现在Harness还是一个快速发展的领域还有很多问题待解决但方向已经很清晰了未来软件开发人类会越来越多做顶层设计具体执行交给AI而Harness就是连接人和AI的那套核心系统。你有没有试过用Harness做项目欢迎在评论区交流你的经验~AI生成

Unity Recorder保姆级教程：从Timeline录制到独立窗口录屏，一次搞定所有格式

Unity Recorder终极指南：从Timeline到独立窗口的全格式录制实战在独立游戏开发和技术美术的工作流中，高质量的视频素材往往决定着项目的第一印象。无论是Steam商店页面的宣传片、社交媒体传播的玩法GIF，还是给投资方展示的垂直切片&#xff0…

2026/5/27 5:34:28 阅读更多

Redis分布式锁进阶第七十六篇

一、本篇前置衔接第九十二篇我们完成Redisson源码拆解、手写复刻、底层内核穿透，彻底明白分布式锁代码层、脚本层、线程层原理。到此为止，代码、源码、坑点、运维、监控、面试全部讲透。但很多开发最大的困惑依旧存在：不同体量公司为什么锁架…

2026/5/27 5:34:28 阅读更多

学生用户画像-考勤主题扩展标签构建、可视化实验文档

学生用户画像：考勤主题扩展标签构建与可视化一、实验名称实验课3：学生用户画像-考勤主题扩展标签构建、可视化。二、实验目的基于 student_attendance_stats 学生考勤主题标签表，使用 K-Means 对迟到、早退、请假、没穿校服等行为指标进行自动…

2026/5/27 5:34:08 阅读更多

传统喷绘还在跟“色差”较劲，会被替代吗

传统喷绘还在跟“色差”较劲时，UV打印早已用纳米级墨滴技术，把色彩还原度锁在了ΔE≤1的精度里——前者对着色卡调三遍色，后者扫一眼样品就能一键复刻金属质感的渐变。当普通刀刮布还在依赖胶水粘贴，磁吸拼接技术已经让30平米的巨…

2026/5/27 6:32:20 阅读更多

SECS/GEM：SF 详细解析(S1F3-＞S1F4)

S1F3 - Selected Equipment Status Request：向设备发出请求，要求其报告其状态的选定数值。S1F4 - Selected Equipment Status Data：该设备会按照所请求的顺序报告每个 SVID 的值。主机会记住所请求值的名称。设置获取设备的SVID：发…

2026/5/27 6:32:00 阅读更多

构建可靠多智能体系统：从记忆、验证到工具链的工程实践

1. 项目概述：从理论到实践的A2A系统构建最近和几个团队交流，发现大家在做多智能体系统时，普遍卡在了一个尴尬的阶段：单个智能体的对话演示跑得挺溜，但一旦要把多个智能体串联起来完成一个实际业务流程，系统…

2026/5/27 6:31:20 阅读更多

Windows 10 自带等宽字体 + Python 制表符表格（5 种效果）+ 控制台字体设置

WIN10有哪些自带等宽字体，想输出一个制表符的表格，每列左对齐，每列字符数自动计算最多几个。有汉字/字母/数字。 python实现，输入一个多行多列的数据，返回制表符表格结果，请实现5种表格效果 PYTHON控制台如何自动修改显示的字体大小，字体名称？ Windows 10 自带等宽字体…

2026/5/27 6:30:39 阅读更多

别再傻傻分不清了！5分钟搞懂Xilinx 7系列FPGA里LC、CLB、Slice、LUT和FF到底啥关系

5分钟构建Xilinx 7系列FPGA资源认知模型：从LC到FF的架构全景解析刚接触Xilinx FPGA设计的工程师，往往会被数据手册中密集出现的LC、CLB、Slice等术语弄得手足无措。这些看似相似的缩写实际上代表着芯片内部不同层级的逻辑资源，理解它们的包含…

2026/5/27 6:30:19 阅读更多

块聚合模型：解决空间数据错配，实现高分辨率风险预测

1. 项目概述与核心价值在公共卫生、环境科学和流行病学研究中，我们常常面临一个令人头疼的“数据错配”问题：我们关心的结果变量，比如某个地区的疾病住院人数，通常只能以行政区划（例如区县）为单位进行统计和…

2026/5/27 6:29:18 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/26 19:57:06 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/26 15:11:34 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/26 11:18:30 阅读更多

相关文章