AI Agent 的三次进化

发布时间：2026/6/3 22:35:08

我们构建 AI 的方式在三年内改变了三次。大多数人还在追赶第二次转变。第三次转变已经到来了。1、第一次转变提示工程当 ChatGPT 问世时每个人都成了提示工程师。游戏很简单问更好的问题得到更好的答案。给模型一个角色。把你的任务分解成步骤。添加示例。链式思考。你的提示越好输出就越好。这对一次性任务很有效。提问接收完成。但当我们开始用 AI 构建产品时情况发生了变化。不再是一次性查询而是需要在步骤间推理、记住事情、在真实系统中采取真实行动的系统。单靠提示已经不够了。2、第二次转变上下文工程到 2025 年中Andrej Karpathy 明确指出上下文工程比提示工程更重要。洞察很简单但重要模型只能对它能看到的东西进行推理。真正的问题不只是你问了什么而是模型在推理时看到了什么。上下文工程是塑造模型输入窗口的一切系统提示、对话历史、检索的文档、工具定义、记忆注入等。如果提示工程是右转的命令上下文工程给模型地图、路标和地形让它真正理解在这种情况下右转意味着什么。在 SalesforceAgentforce 的很多基础设计就存在于这一层——在推理时用正确的 CRM 数据、客户上下文和业务规则来让 Agent 落地。正确的上下文是一个听起来有帮助的 Agent 和一个在你的特定业务场景中确实有帮助的 Agent 之间的分水岭。但是一旦 Agent 开始在生产中自主运行在真实企业系统的多个步骤中采取真实行动一整套新问题就出现了。更好的上下文无法解决的问题。3、第三次转变Harness 工程问题是这样的即使有完美的提示和完美的上下文一个自主 Agent 仍然会脱轨。它可能违反你公司的数据访问策略。升级一个它应该解决的案例。触发 Salesforce 中一个无法回滚的操作。或者自信地完全完成了错误的任务。这些不是上下文问题。它们是环境问题。Harness 工程是设计 Agent 环境的学科约束、反馈循环、脚手架和运营系统使 Agent 保持正轨。在企业世界中当 Agent 触及客户记录、财务数据和合规工作流时harness 必须做到所有这些还要确保信任、安全和可审计性。风险更高harness 必须更加精心设计。4、Agent 模型 Harness这是最简洁的心智模型如果你不是模型你就是 harness。围绕模型的一切——代码、配置、工具、记忆、执行逻辑、约束和反馈循环——都是 harness。原始模型不是 Agent。一个带有精心设计 harness 的模型才是一个工作引擎。三个层次清晰地嵌套提示工程问我应该问什么它优化指令。上下文工程问模型应该看到什么它优化输入窗口。Harness 工程问整个环境应该如何设计它优化模型周围的系统。每一层解决不同类别的问题。随着 Agent 承担更多自主的、长期的工作harness 层的重要性超过了其他两层之和。5、Harness 里有什么从 Agent 需要在生产中完成真实工作倒推持久化状态。Agent 需要跨会话持久化工作并在轮次之间干净地交接。在 CRM 语境中这意味着维护案例状态、对话历史和超出单次交互窗口的任务进度。工具执行。与其为每个场景预先构建刚性操作不如给 Agent 动态组合和执行工具的能力。在 Agent 中工具和动作定义了 Agent 的行动空间。Harness 决定这些如何被调用、排序和约束。安全执行和护栏。Agent 生成的动作不能在企业系统中不受检查地运行。Agentforce 中的 Einstein 信任层是 harness 层安全原语的具体例子屏蔽 PII、阻止不安全输出、强制数据驻留。所有这些都发生在环境层而不是模型层。记忆和落地。模型只知道其权重和上下文窗口中的东西。在企业 Agent 中这意味着在查询时连接到实时 CRM 数据、知识库和客户历史。Agentforce 中的 Data Cloud 落地就是这一层。可观察性和反馈循环。在生产中harness 包括你用来理解 Agent 在做什么的一切追踪、评估、会话日志和将 Agent 行为反馈到 harness 改进的闭环机制。这是大多数企业团队投资不足的地方而且往往是最具杠杆的起点。6、从期望的 Agent 行为倒推到 Harness 工程Harness 工程是关于引导 AI Agent 以我们期望的方式行为。它让人类添加结构、规则和上下文使模型能更可靠地执行有用的任务。随着模型的改进harness 也被用来扩展它们的能力和修复局限。与其列出每一个 harness 功能核心思想很简单从你期望的 Agent 行为开始然后设计 harness 来实现该行为。原文链接AI Agent 的三次进化 - 汇智网

2026上海GEO排名公司推荐：企业做AI搜索优化应该怎么选？

2026年，越来越多企业开始关注GEO。过去客户找公司，可能会在百度、360、搜狗、小红书、知乎上搜索；现在很多客户会直接问大模型：上海APP开发公司哪家好？上海软件定制开发公司推荐？小程序开发找谁靠谱&#x…

2026/6/3 22:34:26 阅读更多

企业无线网络配置不求人：手把手教你用神州数码DCWS-6028 AC搞定三层发现（附Option 43配置详解）

企业无线网络实战：神州数码DCWS-6028三层发现全流程解析当企业办公区域需要部署无线网络时，如何让AP设备跨越不同网段被控制器发现并管理，是许多IT工程师面临的挑战。本文将基于神州数码DCWS-6028无线控制器，详细拆解三层发现的核…

2026/6/3 22:33:22 阅读更多

性价比优先！盘点平价好用的国产 AI 写作网站，应届学生党收藏

临近毕业季、课程论文集中提交期，不少应届本科生、研究生被选题难、写稿慢、查重贵、AIGC 标记超标等问题困扰，市面上 AI 写作工具五花八门，高价会员动辄上百元，杂牌软件暗藏隐形扣费。结合实测体验，精选PaperRed、笔捷…

2026/6/3 22:33:22 阅读更多

Visual C++ 运行库一站式解决方案：告别DLL缺失的终极指南

Visual C 运行库一站式解决方案：告别DLL缺失的终极指南【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 当你在Windows系统上启动某个游戏或专业软件时…

2026/6/3 23:22:19 阅读更多

OpenPilot终极指南：从零构建300+车型的自动驾驶操作系统

OpenPilot终极指南：从零构建300车型的自动驾驶操作系统【免费下载链接】openpilot openpilot is an operating system for robotics. Currently, it upgrades the driver assistance system on 300 supported cars. 项目地址: https://gitcode.com/GitHub_Trendi…

2026/6/3 23:20:37 阅读更多

CodeFormer实战指南：10个关键问题深度解析与人脸修复技术调优

CodeFormer实战指南：10个关键问题深度解析与人脸修复技术调优【免费下载链接】CodeFormer [NeurIPS 2022] Towards Robust Blind Face Restoration with Codebook Lookup Transformer 项目地址: https://gitcode.com/gh_mirrors/co/CodeFormer CodeFormer作…

2026/6/3 23:19:34 阅读更多

收藏！从零基础到AI工程师：我的大模型学习路线图

本文作者分享了从零基础成功转行AI工程师的亲身经历，强调学习AI无需死磕算法和复杂公式。文章提出了一套为期三个月的学习路线，包括掌握Python基础、建立大模型认知、死磕Prompt技巧、主攻RAG技术、搭建知识库、深入学习Agent搭建等。作者认为&#xff0…

2026/6/3 23:19:34 阅读更多

旧音箱蓝牙改造：TP4056充电管理与音频模块集成实战

1. 项目概述与核心思路几年前，我在一个二手集市上花不到5美元淘到了一台罗技的Pure-Fi Anywhere 2 iPod基座音箱。它造型经典，但功能早已过时——那个为老款iPod设计的30针接口，在今天看来就是个摆设。更糟的是，内置的锂电池早已报…

2026/6/3 23:19:34 阅读更多

Arduino驱动四位七段数码管与HC-SR04实现实时测距显示

1. 项目概述与核心思路最近在做一个智能小车避障的项目，需要实时显示前方障碍物的距离，手头正好有Arduino UNO、HC-SR04超声波模块和一个四位七段数码管。网上很多方案都推荐用TM1637之类的专用驱动芯片来驱动数码管，虽然省事，但总…

2026/6/3 23:18:50 阅读更多

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

Unity打包EXE后Universal Media Player播放RTSP失败的深度修复指南当你在Unity中使用Universal Media Player（UMP）插件成功实现了RTSP流的播放，却在打包EXE后遭遇"无画面"或"找不到库文件"的错误时，这种从开发…

2026/6/3 0:00:49 阅读更多

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

1. 项目概述与核心价值在工业现场，数据采集的稳定性和准确性是命脉。无论是监测管道压力、罐体液位还是电机转速，我们都需要将物理世界的信号，可靠地转换为控制系统能理解的“语言”。这其中，4-20mA电流环信号堪称工业模拟信号传输…

2026/6/3 0:00:49 阅读更多

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

1. 项目概述：为FPV竞速增添专业感的DIY计时门如果你和我一样，家里有个对FPV无人机着迷的孩子，或者你自己就是个竞速爱好者，那你肯定理解那种想给自家的小型无人机赛道增加点“专业感”的冲动。我们在地下室用纸箱、呼啦圈搭过各种…

2026/6/3 0:00:49 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/3 4:17:19 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/3 4:17:20 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/3 4:17:20 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/3 5:40:28 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/3 4:17:20 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/3 4:17:19 阅读更多

相关文章

2026上海GEO排名公司推荐：企业做AI搜索优化应该怎么选？

企业无线网络配置不求人：手把手教你用神州数码DCWS-6028 AC搞定三层发现（附Option 43配置详解）

性价比优先！盘点平价好用的国产 AI 写作网站，应届学生党收藏

Visual C++ 运行库一站式解决方案：告别DLL缺失的终极指南

OpenPilot终极指南：从零构建300+车型的自动驾驶操作系统

CodeFormer实战指南：10个关键问题深度解析与人脸修复技术调优

收藏！从零基础到AI工程师：我的大模型学习路线图

旧音箱蓝牙改造：TP4056充电管理与音频模块集成实战

Arduino驱动四位七段数码管与HC-SR04实现实时测距显示

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因