Agent 到底是什么：感知-决策-执行的循环

发布时间：2026/6/10 1:02:58

一只用 AI Agent 搭副业产线的程序员给你看一段对话用户帮我分析这个 Go 项目里有几个 SQL 注入风险 AI好的我来看看……额我没法看你的代码。你把代码贴给我。用户贴代码 AI发现 3 处风险。第 12 行、第 47 行、第 89 行。用户能帮我自动修复吗 AI我做不到我只能给你建议。这是聊天机器人。你问一句它答一句。像个实习生——聪明但不主动。Agent 不是这样的。Agent 是这样的用户帮我检查 project-a 里的 SQL 注入风险自动修好然后跑一下测试确保没挂。 Agent收到。 → 读取 project-a 下所有 .go 文件 → 逐个分析 SQL 拼接 → 发现 3 处风险 → 改成参数化查询 → 执行 go test ./... → 测试通过 ✓ → 输出修改报告Agent 和聊天机器人的区别就一个词自主行动。这篇我们用 100 行 Go 代码写一个最小的 Agent让你看到它的核心骨架。Agent 的骨架感知-决策-执行循环所有 Agent不管多复杂拆开就是三个步骤的循环┌─────────────────────────────────────────────┐ │ │ │ ① 感知Perception │ │ 读取环境信息——文件、API 返回、用户输入 │ │ ↓ │ │ ② 决策Decision │ │ 用 LLM 分析当前状态决定下一步做什么 │ │ ↓ │ │ ③ 执行Execution │ │ 调用工具、操作文件、发送请求产生实际效果 │ │ ↓ │ │ 回到 ①直到任务完成 │ │ │ └─────────────────────────────────────────────┘这跟你每天上班一模一样看 Jira → 决定做什么 → 写代码 → 看结果 → 决定下一步。Agent 只是把这个过程自动化了。100 行 Go 实现不废话直接上代码。packagemainimport(bytesencoding/jsonfmtionet/httposstrings)// Message 对话消息typeMessagestruct{Rolestringjson:roleContentstringjson:content}// ToolCall 工具调用请求typeToolCallstruct{Namestringjson:nameArgumentsstringjson:arguments}// LLMResponse LLM 返回typeLLMResponsestruct{Contentstringjson:contentToolCalls[]ToolCalljson:tool_calls,omitempty}// Agent 最小 Agent 实现typeAgentstruct{apiKeystringmessages[]Message toolsmap[string]func(string)string// 工具名 → 执行函数maxStepsint}funcNewAgent(apiKeystring)*Agent{returnAgent{apiKey:apiKey,maxSteps:10,tools:make(map[string]func(string)string),}}// RegisterTool 注册一个工具func(a*Agent)RegisterTool(namestring,fnfunc(string)string){a.tools[name]fn}// Run 启动 Agent 循环func(a*Agent)Run(taskstring)string{// 初始化只告诉 Agent 任务a.messages[]Message{{Role:system,Content:a.buildSystemPrompt()},{Role:user,Content:task},}// 主循环感知 → 决策 → 执行forstep:0;stepa.maxSteps;step{fmt.Printf(--- Step %d ---\n,step1)// ① 决策调用 LLM让它决定下一步resp:a.callLLM()// ② 如果 LLM 决定调用工具 → 执行iflen(resp.ToolCalls)0{for_,tc:rangeresp.ToolCalls{fmt.Printf( 调用工具: %s(%s)\n,tc.Name,tc.Arguments)result:a.executeTool(tc)// ③ 把执行结果反馈给 LLM感知 → 下一轮决策a.messagesappend(a.messages,Message{Role:user,Content:fmt.Sprintf(工具 %s 的执行结果%s,tc.Name,result),})}continue}// ④ 没有工具调用 → 任务完成返回最终答案returnresp.Content}return达到最大步数限制}func(a*Agent)buildSystemPrompt()string{vartoolDescs[]stringforname:rangea.tools{toolDescsappend(toolDescs,name)}returnfmt.Sprintf(你是一个自主 Agent。完成任务时如果需要使用工具在回复中以 JSON 格式指定工具调用 {tool_calls: [{name: 工具名, arguments: 参数}]} 可用工具%s 当你不再需要工具时直接输出最终答案。,strings.Join(toolDescs,, ))}func(a*Agent)callLLM()LLMResponse{body,_:json.Marshal(map[string]interface{}{model:deepseek-v4-pro,messages:a.messages,})req,_:http.NewRequest(POST,https://api.deepseek.com/anthropic/v1/messages,bytes.NewReader(body))req.Header.Set(Authorization,Bearer a.apiKey)req.Header.Set(Content-Type,application/json)resp,_:http.DefaultClient.Do(req)deferresp.Body.Close()data,_:io.ReadAll(resp.Body)varllmResp LLMResponse json.Unmarshal(data,llmResp)// 记录 LLM 的回复到历史a.messagesappend(a.messages,Message{Role:assistant,Content:llmResp.Content,})returnllmResp}func(a*Agent)executeTool(tc ToolCall)string{fn,ok:a.tools[tc.Name]if!ok{returnfmt.Sprintf(错误未知工具 %s,tc.Name)}returnfn(tc.Arguments)}// ──────────── 示例工具 ────────────funcmain(){agent:NewAgent(os.Getenv(DEEPSEEK_API_KEY))// 注册工具读取文件agent.RegisterTool(read_file,func(pathstring)string{content,err:os.ReadFile(strings.TrimSpace(path))iferr!nil{returnfmt.Sprintf(读取失败%v,err)}returnstring(content)})// 注册工具运行命令agent.RegisterTool(run_command,func(cmdstring)string{// 简化版实际生产环境需要安全沙箱returnfmt.Sprintf(命令 %s 执行成功模拟,cmd)})result:agent.Run(读取 main.go 文件检查里面有没有 TODO 注释)fmt.Println(\n✅ 最终结果,result)}拆解这个循环核心就 30 行——Run方法里的for循环forstep:0;stepa.maxSteps;step{resp:a.callLLM()// 决策AI 想下一步做什么iflen(resp.ToolCalls)0{result:a.executeTool()// 执行AI 想用工具就执行a.messagesappend(...)// 感知把结果告诉 AIcontinue// 回到决策}returnresp.Content// 完成AI 不想用工具了输出答案}这就是 Agent 的全部秘密。不是什么黑科技就是一个for循环包着一个 LLM 调用。为什么这个模式这么强普通聊天用户 → AI → 用户 → AI单向一步一问。Agent用户 → AI → 工具 → AI → 工具 → AI → 答案AI 能自己驱动流程。AI 从一个「回答问题的人」变成了「完成任务的人」。这个转变的威力有多大想象一下——以前你让 AI 帮你修 Bug你得把代码贴给 AIAI 告诉你哪里有问题你手动改把改完的代码贴给 AI 确认重复 2-4Agent 模式下你一句话它全干了。一个真实的坑死循环我第一次写 Agent 的时候忘了加maxSteps。结果 AI 陷入了一个循环读文件 → 觉得没读对 → 又读了一次 → 又觉得没读对……10 秒钟烧了 15 次 API 调用全在重复同一件事。maxSteps 是 Agent 的安全带。永远都要设。建议值简单任务 5中等任务 10复杂任务 20。超过 20 步的任务建议拆成多个子任务单独跑。本篇核心收获概念一句话Agent 本质感知-决策-执行的循环核心代码for callLLM executeTool与聊天机器人区别Agent 能自主调用工具驱动任务完成必须的安全措施maxSteps 防止死循环100 行 Go 代码一个for循环你就有了一个能自主完成任务的 Agent。下一篇我们深入 Agent 最核心的能力——Function CallingAI 是怎么知道该调用哪个函数的JSON Schema 怎么定义函数执行出错了怎么办完整实现一行不跳。关注我别错过。一只用 AI Agent 搭副业产线的程序员全平台同名虾哥不加班需要定制 AI 工具来聊聊 → lob_ai源码GitHub - lobster-bujiaban

手打内容被判定AI？从误判到安全，全靠这3大免费指令和5款工具

相信这段时间，很多朋友为降ai率操碎了心，有些时候纯人工手打的内容都会被误判为AI生成。其实遇到这种情况不用慌，只要找到合适的降ai率工具，就能把因为用词太规范而产生的误判降下来。今天就来盘点一波实用干货，有3个…

2026/6/10 1:02:17 阅读更多

2026降AI工具实测避坑：这5款真的好用吗？测评+教程全公开

大家为了给初稿降ai肯定搜过各种各样的免费降ai率工具，甚至去尝试过那些乱七八糟的文本重写偏方。我听有的伙伴说自己改了一通宵，结果钱花了也没能有效优化文本，文章反而被改得语无伦次排版全乱。作为经历过这些的过来人，我太懂…

2026/6/10 1:01:16 阅读更多

全栈开发者从想法到 MVP：快速原型方法论与工程化交付实践

全栈开发者从想法到 MVP：快速原型方法论与工程化交付实践一、从想法到产品的"死亡谷"：为什么 90% 的原型没能上线？ 全栈开发者最常见的工作模式是：周末冒出一个想法，花两天搭建原型，然后……就没…

2026/6/10 1:00:35 阅读更多

保姆级教程：用ArcGIS Pro计算北京水网密度，从数据准备到出图一步到位

ArcGIS Pro实战：北京水网密度计算全流程精解水网密度分析是城市规划、生态研究中的基础性工作。作为地理信息系统的核心工具，ArcGIS Pro凭借其强大的空间分析能力，能够高效完成从数据准备到成果可视化的全流程操作。不同于传统教程的碎片化指…

2026/6/10 5:01:09 阅读更多

从零到一：手把手教你用TensorFlow 2.x复现微软DSSM双塔模型（附完整代码）

从零到一：手把手教你用TensorFlow 2.x复现微软DSSM双塔模型（附完整代码）在推荐系统领域，双塔模型已经成为召回和粗排阶段的标准配置。微软2013年提出的DSSM（Deep Structured Semantic Models）作为这一架构的…

2026/6/10 5:01:09 阅读更多

LPC408x/7x微控制器焊接工艺全解析：从封装设计到回流焊实战

1. 项目概述：为什么LPC408x/7x的焊接工艺值得深究在嵌入式硬件开发这条路上，我踩过不少坑，其中关于微控制器焊接的“学费”交得尤其多。很多工程师，包括当年的我，拿到一颗像NXP LPC408x/7x这样的ARM Cortex-M4芯片&…

2026/6/10 5:01:09 阅读更多

别再死记硬背了！用这5个真实靶场案例，彻底搞懂SQL注入、XSS、CSRF的实战防御

5个真实靶场案例：从SQL注入到CSRF的实战攻防演练在网络安全领域，理论知识固然重要，但真正能让你快速成长的永远是实战经验。本文将带你通过DVWA、Pikachu等常见靶场中的5个典型案例，深入理解SQL注入、XSS、CSRF等常见漏洞的攻击原…

2026/6/10 5:01:09 阅读更多

2022 vs 2026：AI大模型的四年跨越——从“能聊天“到“能做事“的质变之路

2022 vs 2026：AI大模型的四年跨越——从"能聊天"到"能做事"的质变之路 🔥 深度长文 | 关键词：大模型演进、GPT-3.5、GPT-5、DeepSeek V4、AI Agent、多模态、长上下文、Scaling Law 📅 时间跨度：2…

2026/6/10 5:00:08 阅读更多

RESTful API可以使用XML格式或JSON格式来传输数据

RESTful API可以使用XML格式或JSON格式来传输数据。这两种格式都是常见的数据交换格式，具有各自的优势和适用场景。 XML（可扩展标记语言）是一种用于描述数据的标记语言，它具有良好的可读性和可扩展性。XML格式的数据可以通过标签和…

2026/6/10 4:59:07 阅读更多

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析【免费下载链接】NomNom NomNom is the most complete savegame editor for NMS but also shows additional information around the data youre about to change. You can also easily look up each …

2026/6/10 0:00:34 阅读更多

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

从导航软件到游戏寻路：用C手把手实现Dijkstra最短路径算法每次打开手机地图导航，或是操控游戏角色穿越复杂地形时，背后都藏着一个数学魔法——最短路径算法。Dijkstra算法作为图论中的经典解决方案，从1956年诞生至今，已…

2026/6/10 0:01:14 阅读更多

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱，支持下载视频、番剧等等各类资源项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/6/10 0:02:17 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/10 0:41:57 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/10 0:41:54 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/10 0:32:14 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/9 9:53:26 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/9 9:53:26 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/9 9:53:22 阅读更多

相关文章

手打内容被判定AI？从误判到安全，全靠这3大免费指令和5款工具

2026降AI工具实测避坑：这5款真的好用吗？测评+教程全公开

全栈开发者从想法到 MVP：快速原型方法论与工程化交付实践

保姆级教程：用ArcGIS Pro计算北京水网密度，从数据准备到出图一步到位

从零到一：手把手教你用TensorFlow 2.x复现微软DSSM双塔模型（附完整代码）

LPC408x/7x微控制器焊接工艺全解析：从封装设计到回流焊实战

别再死记硬背了！用这5个真实靶场案例，彻底搞懂SQL注入、XSS、CSRF的实战防御

2022 vs 2026：AI大模型的四年跨越——从“能聊天“到“能做事“的质变之路

RESTful API可以使用XML格式或JSON格式来传输数据

NomNom存档编辑器架构解析：跨平台游戏数据管理技术实现深度剖析

从导航软件到游戏寻路：用C++手把手实现Dijkstra最短路径算法（附完整代码）

告别B站收藏夹吃灰：用BiliTools让每一秒学习都物超所值

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因