AI工程范式的又一次演进：Harness Engineering

发布时间：2026/6/23 18:49:53

如果按月份来给AI领域划分关键词那么2月份大概属于openclaw而从3月开始这个关键词则逐渐变成了Harness Engineering。作为近两个月新兴的核心概念围绕Harness Engineering的讨论迅速展开相关文章也层出不穷。但其中相当一部分内容停留在概念层面的反复堆砌读完之后往往只剩下模糊的印象甚至会觉得莫名其妙而难以形成有效的认知。所以我打算聊一聊自己对这个概念的理解。Harness Engineering的正式采用了这个术语并给出了大规模实践案例使这个词迅速在行业内传播开来。演进历程要理解 Harness Engineering最好的方式是把它放到 AI 工程实践的演进脉络中去看。从 2022 年底 ChatGPT 引爆大模型浪潮至今工程师们围绕“如何更好地使用大模型”这个核心命题已经走过了三个清晰的阶段Prompt Engineering → Context Engineering → Harness Engineering。每一次范式的跃迁都不是对前一阶段的否定而是解决了前一阶段未能覆盖的问题。Prompt Engineering如何与大模型对话时间线2022 年底 ~ 2024 年初这是一切的起点。当大模型刚刚进入开发者视野时最直接的问题是怎么让它按我的意思来于是 Prompt Engineering提示词工程应运而生。它的核心在于精心设计输入给模型的文本指令通过措辞、格式、示例的调整来引导模型产出期望的结果。这个阶段的典型实践包括角色设定「你是一个资深的 Java 架构师请基于以下需求...」少样本学习Few-shot在 prompt 中嵌入几组输入-输出示例让模型模仿格式和风格思维链Chain of Thought引导模型「一步步思考」提升推理任务的准确率输出格式约束「请以 JSON 格式返回包含以下字段...」Prompt Engineering 的价值是真实的——在很多场景下一个精心设计的 prompt 确实能显著提升模型输出质量。但它的局限也同样明显Prompt 本质上是一次性的静态指令。当任务变得复杂、需要多步推理、需要引用外部知识时仅靠 prompt 的措辞技巧已经不够用了。你可以把一个 prompt 写到 2000 字把所有的约束、示例、上下文都塞进去但这就像试图在一封信里把所有事情交代清楚——信息越多模型越容易迷失重点。Context Engineering信息编排的工程时间线2024 年初 ~ 2025 年底随着 RAG检索增强生成、Function Calling、多轮对话记忆管理等技术的成熟工程师们意识到比起在 prompt 里堆砌文字更重要的是在正确的时机向模型提供正确的信息。这就是 Context Engineering上下文工程的核心理念。它不再只关注“怎么写提示词”而是把注意力转移到如何动态构建和管理模型的输入上下文。Context Engineering 的典型实践包括RAG根据用户查询从知识库中检索相关文档片段动态注入上下文Tool / Function Calling让模型在推理过程中主动调用外部工具获取实时信息Memory对多轮对话历史进行摘要、压缩、裁剪确保有限的上下文窗口被高效利用System Prompt 模板化根据不同场景动态组装 system prompt而非一成不变的静态文本如果说 Prompt Engineering 是“教你怎么写一封好信”那 Context Engineering 就是“设计一套信息投递系统让合适的信息在合适的时候到达合适的位置”。这个阶段的工程复杂度明显上升开发者不再只是调 prompt而是开始构建向量数据库、设计检索策略、工具管理、多步调用链路编排。围绕 LangChain、LlamaIndex 等框架的生态也在这个阶段快速发展。但 Context Engineering 仍然有一个隐含的前提人在回路中。大多数场景下模型在人类的直接监督下运行——一次调用、一次审核、一次反馈。当我们开始追求让 AI 自主完成复杂的多步任务也就是进入AI Agent的领域时新的问题浮出了水面上下文可以编排得很好但 Agent 在自主执行的过程中会偏离轨道、会产生幻觉、会在工具调用中犯错、会把有限的 token 预算耗尽在无意义的循环上——而这时没有人类在旁边及时纠偏。Harness Engineering从驾驭对话到驾驭智能体这就是 Harness Engineering 登场的背景。Harness Engineering的直译就是驾驭工程它的目标是通过构建受控、可靠、自动化的运行环境使大模型智能体AI Agent能在无人持续干预下稳定、安全、高效地完成复杂任务。注意这里的关键词——“无人持续干预”。Prompt Engineering 和 Context Engineering 本质上都在优化人机交互的单次质量而 Harness Engineering 要解决的是当你放手之后Agent 还能不能靠谱地跑下去一个有趣的渊源Test HarnessHarness这个词在软件领域并不陌生。如果你有过测试工程的经验大概率听说过Test Harness测试用具一组 stubs桩和 drivers驱动的集合用于在生产环境不可用时为被测组件模拟运行环境使测试可自动化、可重复、可隔离。我觉得 Harness Engineering 或多或少借鉴了这个概念。两者共享同一个隐喻——harness挽具/缰绳用一套外部基础设施“套住”一个核心组件使其行为可控。但从 Test Harness 到 Agent Harness包裹的对象从确定性的代码变成了不确定性的模型复杂度完全不同。Test Harness 面对的被测代码给定相同输入必定产生相同输出需要控制的只是外部依赖。而 Agent Harness 面对的大模型天然具有随机性即使相同的输入也可能产出不同的结果需要控制的是模型本身的不确定行为。所以严格来说Harness这个词在软件领域有几十年历史但Harness Engineering作为一个面向 AI Agent 的工程理念是 2026 年的新提法。它借用了传统 Test Harness 的隐喻但指向的问题域是全新的。一个不发明新技术的“新概念”坦率地说Harness Engineering 是一个综述性概念。它没有发明任何新技术——工具调用、状态管理、上下文压缩、护栏Guardrails、沙箱隔离——这些东西在 Harness 这个词出现之前就已经存在了。从这个角度看它和当年的DevOps、Platform Engineering、MLOps如出一辙给一组已有的实践起了一个名字画了一个边界建立了一套共识。但这恰恰是它的价值所在。在 DevOps 这个词出现之前开发和运维之间的协作实践已经零散地存在了——CI/CD、基础设施即代码、监控告警——但直到 DevOps 把这些实践命名为一个整体行业才形成了系统性的方法论才有了成熟的工具链和组织架构的变革。Harness Engineering 正处在类似的节点上。它把围绕 AI Agent 的各种工程实践——沙箱环境、工具注册与权限控制、状态持久化与恢复、上下文窗口管理、护栏策略、可观测性——统一纳入一个框架。这不是简单地换一个说法而是实践出真知并用这种真知指导未来的发展。一个更直觉的理解方式如果上面的技术描述还是有些抽象不妨换一个更直觉的类比。想象 AI 是一匹野马。这匹马动力十足、耐力惊人但野性难驯。你想借助它日行千里但你绝不想让它把你带到沟里去。三个阶段对应的就是驯马术的三个层次Prompt Engineering提示词工程像在旁边“喊话”——“左转慢点停”。马听不听取决于你喊得够不够准即使你喊得准马偶尔还是会不听。Context Engineering上下文工程给马提供“地图”和“路标”——让它知道前方是什么路况、应该往哪走。马的视野变广了但它仍然可能我行我素。Harness Engineering驾驭工程给马套上缰绳马鞍护栏并建好赛道加油站自动检修站。马依然是那匹马动力和能力没变但整个运行环境确保它只能在安全的范围内奔跑跑偏了会被纠正累了会自动补给出了问题会被及时发现。这三层不是替代关系而是叠加关系。好的 prompt 依然重要精准的上下文依然关键而 Harness 在此基础上加的这一层解决的是 Agent长时间自主运行时的可控性问题。结语Harness Engineering的重点不在于 Harness而在于Engineering。在软件工程领域Engineering工程这个词的含义远远超出了“编程”或“写代码”。它强调的是系统性、规范化、可预测、以及协作性地构建和维护复杂软件系统的全过程。从需求分析、架构设计到测试验证、持续交付再到监控运维——工程关注的从来不只是“能不能跑起来”而是“能不能可靠地、持续地、可维护地跑下去”。这恰好也是 AI Agent 当前面临的核心挑战。模型的能力已经足够强大但让强大的能力稳定地、安全地、可预期地交付价值——这是一个工程问题不是一个模型问题。

证书推荐考哪些女生实用？2026年高含金量与好就业的考证避坑指南

身边很多女生聊到职场，总绕不开相似的焦虑： 做了两三年行政 / 运营，感觉工作都是打杂，随时能被替代； 想跳槽却没拿得出手的硬技能，简历投出去石沉大海； 担心 35 岁危机，想找个越老越…

2026/6/23 18:48:05 阅读更多

AI-Web1靶机实战：从Web渗透到系统提权的完整攻击链解析

1. 项目概述：从“AI-Web1”靶机看实战渗透的思维构建最近在Vulnhub上看到一个挺有意思的靶机，叫“AI-Web1”。光看名字，你可能会觉得它和人工智能或者Web应用安全强相关，这确实没错，但它的价值远不止于此。这个靶机更像…

2026/6/23 18:45:35 阅读更多

Ubuntu 20.04 下 Nextcloud Snap 部署避坑指南：SSL、权限与反向代理实战

1. 为什么 Ubuntu 20.04 用户还在为 Nextcloud 安装反复折腾？ 我第一次在 Ubuntu 20.04 上部署 Nextcloud 是 2021 年初，当时手头只有一台闲置的旧笔记本，想搭个私有云存照片和文档。结果光是环境准备就卡了三天——Apache 配置冲突、PHP 扩…

2026/6/23 18:44:31 阅读更多

用 Claude Opus 4.8 辅助生成接口测试用例：一个 Spring Boot 项目的实践记录

文章摘要：本文介绍了如何利用AI工具（如Claude Opus 4.8）辅助生成接口测试用例，以SpringBoot项目中的"优惠券领取接口"为例。文章详细说明了从结构化输入、生成测试用例表格、结合代码补充测试场景，到转换为可…

2026/6/23 21:22:34 阅读更多

ADM云GPU私有化部署Z-Image模型+ComfyUI远程访问

上次我们介绍了在云切片上私有部署 LTC-Video 开源大模型的方法，很多朋友说不能用 ComfyUI，也不能远程访问。其实用点小技巧是可以的，不仅可以用 ComfyUI，也可以通过 API 远程访问云切片上的大模型。这次我们就用开源 Z-Image …

2026/6/23 21:22:11 阅读更多

如何高效使用B站购票自动化工具：biliTickerBuy完整实战指南

如何高效使用B站购票自动化工具：biliTickerBuy完整实战指南【免费下载链接】biliTickerBuy b站会员购购票辅助工具项目地址: https://gitcode.com/GitHub_Trending/bi/biliTickerBuy 还在为Bilibili热门活动门票抢购而烦恼吗？今天为大家介绍一款…

2026/6/23 21:18:49 阅读更多

微信智能客服如何避免“答非所问”与“消息漏回”？

在数字化客户运营的深水区，微信生态已经成为企业连接客户的最核心枢纽。随着私域流量池的不断扩大，微信群运营、微信销售助手等场景下的消息吞吐量呈指数级增长。然而，单纯依赖增加人工客服数量，不仅成本高昂，且难以保…

2026/6/23 21:18:28 阅读更多

网盘直链下载助手：5分钟告别限速，实现免客户端高速下载

网盘直链下载助手：5分钟告别限速，实现免客户端高速下载【免费下载链接】baiduyun 油猴脚本 - 一个免费开源的网盘下载助手项目地址: https://gitcode.com/gh_mirrors/ba/baiduyun 你是否曾为网盘下载速度慢如蜗牛而烦恼？是否厌倦了每…

2026/6/23 21:16:06 阅读更多

三月七小助手：每天为你节省2小时游戏时间的崩坏星穹铁道自动化工具

三月七小助手：每天为你节省2小时游戏时间的崩坏星穹铁道自动化工具【免费下载链接】March7thAssistant 崩坏：星穹铁道全自动三月七小助手项目地址: https://gitcode.com/gh_mirrors/ma/March7thAssistant 你是否每天花费大量时间在《崩坏&…

2026/6/23 21:14:23 阅读更多

AI谈判中透明度与人格特质如何影响人机信任与合作

1. 项目概述：当AI成为谈判桌上的“新同事”最近几年，AI从后台的“计算器”逐渐走向前台，开始扮演“协作者”甚至“谈判者”的角色。无论是电商平台的智能议价客服，还是企业内部用于采购、资源分配的自动化谈判代理，人机…

2026/6/23 0:00:12 阅读更多

跨平台Java开发：构建无处不在的应用

在当今数字化时代，应用的跨平台能力已成为企业竞争的关键因素。无论是移动设备、桌面系统还是嵌入式设备，用户都期望能够无缝访问他们喜爱的应用。Java，作为一种成熟且强大的编程语言，凭借其“一次编写，到处运行”的核…

2026/6/23 0:01:34 阅读更多

解锁学术高效写法！paperxie智能写作，搞定毕业论文全程难题

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/课程论文毕业论文 - PaperXie智能写作PaperXieAi论文智能生成软件，10分钟生成万字毕业论文、期刊论文、文献综述、PPT，Aigc查重、降重报告、文献资料。只需一个标题，从开…

2026/6/23 0:02:15 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/23 0:12:24 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/23 0:12:20 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/23 0:12:27 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/23 12:17:43 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/23 12:17:43 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/23 12:17:43 阅读更多