当 Harness 遇上 CMMI

发布时间：2026/5/27 2:44:34

Harness工程让AI正确地做事CMMI让人正确地做事。把AI当作人CMMI同样适用于AI。一、问题的提出过去两年AI 在工程中的角色发生了根本性变化早期AI 是一次性工具发一条 Prompt拿一个答案结束。现在AI 长期参与产品开发跨任务协作与人或其他 AI 配合甚至会记住上下文、维护状态、调用工具链。当 AI 不再是一次性调用而是持续参与生产过程的角色它就具备了可被管理、可被规范、可被度量的特征——这正是 CMMI能力成熟度模型集成的用武之地。二、核心类比为什么CMMI适用于AI维度人AISkill/Harness模式输入需求文档、任务单Prompt、上下文、工具调用接口输出代码、文档、设计方案生成内容、工具执行结果出错方式理解偏差、粗心、遗漏幻觉、偏离指令、不一致能力差异经验、培训、技能水平模型能力、Prompt 质量、Skill 定义改进方式培训、复盘、流程约束Few-shot、Skill 迭代、输出校验这张表的每一列都说明同一件事AI的行为偏差在结构上与人类高度相似。CMMI 以过程纪律来约束人的偏差同理也可以用来约束 AI 的偏差。三、CMMI关键过程域在Harness工程中的映射3.1需求开发与管理RDM→Skill目标定义AI 也需要需求。Skill的目标描述 AI 的需求文档输入/输出Schema 接口需求约束条件风格、格式、禁止行为非功能需求实践建议每个 Skill 必须有 objective.md明确 success criteriaSkill 的输入输出契约用 JSON Schema 定义可自动化校验追溯至人类任务或产品需求建立双向可追溯性3.2计划PLAN监控管理MC→Harness执行计划AI 任务也是工作包。Skill调用计划项目计划Token /成本预算资源估算重试策略、降级策略风险管理执行日志过程可追溯实例实践建议每次 AI 执行一个可度量的工作单元记录失败率、一致性指标建立过程性能基线PPB对超出预算Token/时间的任务触发告3.3配置管理CM→Prompt/Skill/脚本版本化AI 的产物同样需要版本化这是最容易忽视却最关键的一点。Prompt 版本Skill 版本脚本版本知识库 / Few-shot 示例版本实践建议Git 管理 skills/、harness/、prompts/ 目录每个 AI 输出必须可追溯至Model versionSkill versionInput snapshot输入快照改变 Prompt 或 Skill 后必须有回归测试3.4过程资产开发PAD过程管理PCM→定义AI正确做事的标准这是 CMMI 与 Harness 工程结合的核心如何写SkillSOP 定义如何验证Skill验证与确认如何评审AI输出同行评审何时人工介入门禁机制如何升级Skill持续改进CARSkill的标准目录结构参考PAD思想skill/├── prompt.md #作业指导书SOP├── schema.in.json #输入需求├── schema.out.json #输出契约├── examples/ #培训样例Few-shot├── test-cases/ #验证材料└── metric.md #绩效考核标准3.5验证与确认VV→AI输出不是终点AI 生成的内容是中间产品不是最终交付物。AI 生成代码 → 静态检查单元测试AI 生成方案 → 人评审 / A/B 测试AI 调用结果 → 契约校验Schema 验证实践建议自动校验脚本schema / test / lint作为必经门禁AI 输出不能直接合并到主干必须通过人工签名门禁交叉验证AI 审 AI多模型交叉人审 AI抽样审计3.6绩效管理MPM→过程能力基线这是 CMMI 量化管理的核心也是 AI 工程最值得投入的方向。度量指标对应CMMI实践工程意义一次通过率PLAN/MPMSkill 质量的直接反映人工干预率MCAI 自主能力的上限回归错误率VV输出稳定性Token 效率Token/任务EST成本可控性平均重试次数MC过程可靠性这些指标累积起来就是 AI 的过程性能基线PPB可以用来做预测和量化管理。四、为什么这是必然可行的4.1 AI已从工具变为角色当 AI 拥有持久状态上下文窗口 / 记忆文件工具调用能力读文件、执行代码、调 API多轮协作能力与人对话、与其他 AI 配合它就不再是一个函数调用而是一个有角色职责的加工者。对加工者的管理CMMI 有 30 年的积累。4.2 Harness工程已经是过程工程Harness脚本编排、Skill 调度、工具链整合的本质是过程控制流顺序 / 分支 / 重试 / 人工审批对应 CMMI 的流程定义、过程监控、风险管理所以 Harness 工程与 CMMI 的结合不是勉强套用而是天然契合。4.3 CMMI的本质不是人而是可控、可改进的过程CMMI 的每一个实践域描述的都是如何确保一群执行者的输出是可预期的、可追溯的、可改进的这个定义里没有人这个限定词。执行者是人或者是 AI在过程管理的意义上是等价的。4.4不引入过程纪律AI规模化管理必然失控这是最根本的判断。当你有10 个 Skill100 个 Prompt 模板1000 次 AI 调用/天没有版本管理、没有输出校验、没有性能度量系统必然会退化——Prompt 漂移、Skill 冲突、输出质量不可控。CMMI 就是防止这种退化的工程纪律。5 再次强调Harness工程解决AI能不能把事做成CMMI解决AI是否持续、可靠、可控地把正确的事做成。当AI成为生产成员CMMI就是它的工程纪律。

别再硬编码了！用HTN框架5分钟搞定游戏AI的‘最优路径’决策（附Unity/Unreal插件对比）

别再硬编码了！用HTN框架5分钟搞定游戏AI的‘最优路径’决策（附Unity/Unreal插件对比）在《最后生还者2》的潜行关卡中，敌人AI会动态评估弹药存量、掩体位置和玩家动向，选择包抄路线或呼叫增援——这种多目标决策背后&am…

2026/5/27 2:44:14 阅读更多

在银河麒麟V10上装VirtualBox增强工具，卡在SELinux policy.29错误？试试这个临时关闭SELinux的完整流程

银河麒麟V10系统下VirtualBox增强工具安装受阻的SELinux策略解决方案在国产操作系统银河麒麟V10上进行虚拟化开发时，许多工程师选择VirtualBox作为轻量级虚拟化解决方案。然而，当尝试安装VirtualBox Guest Additions（增强工具）以…

2026/5/27 2:42:53 阅读更多

别再只会换阿里源了！深入理解Ubuntu apt源与DNS配置，一劳永逸解决各类更新错误

深入解析Ubuntu apt更新机制：从DNS到源选择的系统级解决方案每次遇到E: Some index files failed to download的错误提示就条件反射地更换阿里源，这可能是大多数Ubuntu用户的真实写照。但作为一个追求技术深度的用户，我们需要理解这背后的运行…

2026/5/27 2:42:33 阅读更多

C语言跨平台桌面UI突围！libui-ng实战对比Win32、GTK老牌方案

一、桌面开发风口热议 C原生GUI格局彻底改写长久以来C语言桌面可视化开发一直深陷平台壁垒困境，单一系统框架无法通用、跨端适配工作量巨大，是无数底层开发者共同头疼的难题。新生代开源库libui-ng快速走红，直接填补了C语言轻量原生跨平台UI的…

2026/5/27 4:51:25 阅读更多

GitHub学生开发者包：免费获取专业开发工具链的完整指南

1. 项目概述：为什么你需要这个开发者工具包如果你是一名正在学习编程的学生，我猜你肯定经历过这样的时刻：脑子里蹦出一个绝妙的点子，想做一个炫酷的个人作品集网站，或者一个能解决实际问题的Web应用。你兴致勃勃地跟…

2026/5/27 4:49:03 阅读更多

从CPU到GPU：手把手拆解CUDA编程里那些‘看不见’的硬件调度（以NVIDIA Ampere架构为例）

从CPU到GPU：手把手拆解CUDA编程里那些‘看不见’的硬件调度（以NVIDIA Ampere架构为例）当你在CUDA内核中写下if (threadIdx.x % 2 0)这样的条件判断时，是否思考过这个简单的分支语句在GPU硬件层面会引发怎样的风暴？本文…

2026/5/27 4:49:03 阅读更多

STM32H743用CubeMX+LwIP搞mDNS，让设备在局域网里有个好记的名字

STM32H743实战：用CubeMXLwIP实现零配置局域网设备发现在智能家居和工业物联网场景中，我们常常需要快速定位嵌入式设备的网络位置。想象一下这样的场景：当你将开发板接入办公室网络后，无需查看路由器列表或记忆复杂的IP地址&#x…

2026/5/27 4:48:23 阅读更多

Nintendo Switch文件管理终极指南：如何用NSC_Builder轻松管理你的游戏库

Nintendo Switch文件管理终极指南：如何用NSC_Builder轻松管理你的游戏库【免费下载链接】NSC_BUILDER Nintendo Switch Cleaner and Builder. A batchfile, python and html script based in hacbuild and Nuts python libraries. Designed initially to erase tit…

2026/5/27 4:47:58 阅读更多

联想电脑安装CentOS 7卡在“基础软件仓库出错”？别慌，这是最全的U盘启动修复教程

联想电脑安装CentOS 7卡在“基础软件仓库出错”的终极解决方案当你满怀期待地准备在联想电脑上安装CentOS 7，却在关键时刻遭遇"设置基础软件仓库时出错"的提示，那种挫败感我深有体会。这不是个例——根据社区反馈，约15%的联想用户在…

2026/5/27 4:47:58 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/26 19:57:06 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/26 15:11:34 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/26 11:18:30 阅读更多

相关文章