【Agent智能体8 | 反思设计模式-大语言模型反思机制的四个演进阶段】

发布时间：2026/5/27 18:11:43

声明本篇博客是以吴恩达的【Agent智能体】教程为基础并对其中的内容做了笔记整理以及个人收获的总结。大模型的反思机制跟人类一样有时会反思自己的输出并寻求改进。这篇文章主要是介绍反思机制的演进过程。人类的反思机制Reflection - humans这张图展示了人类在日常工作中是如何运用“反思”的人类写出一封初版邮件发现问题在发送前进行自我检查发现了几个问题“下个月next month”缺乏具体日期。把“free”打成了“fre”。忘记在文末署名。改进经过反思和修改输出了完善后的第二版邮件Email V2总结写初稿→\rightarrow→审查→\rightarrow→修改出终稿这是人类保证工作质量的本能习惯。智能体 AI 的反思机制Reflection - Agentic AI智能体的反思机制也是类似的我们可以将人类的反思机制映射到 AI 大语言模型的工作流中开始给 LLM 下达“写一封邮件”的指令LLM 生成第一版草稿Email V1。反思在传统的应用中V1 会被直接输出给用户。但在智能体工作流中系统会将被放入一个硬编码的反馈循环中要求 LLM “反思并写出改进后的第二版Reflect and write improved second draft”。通过让 LLM 扮演“审查者”的角色对自己的初始输出进行纠错从而输出质量更高的最终版本Email v2。这个例子是把这个流程硬编码下来先提示LLM写一遍再提示它反思和改进。类似的流程也能优化其他类型的输出例子如下用于改进代码的反思Reflection to improve code这个例子展示了反思机制在编程中的具体应用开始要求写一段代码task X第一个 LLM 生成初版代码code V1。反思多模型协作初版代码被送入LLM 2进行审查。图中标注LLM 2 可以是一个不同的模型例如专门针对代码或逻辑训练的推理模型。LLM 2 检查 Bug 并写出改进后的第二版代码do_task_v2。这个例子告诉我们在复杂任务中生成代码和审查代码可以由不同的 AI 模型负责利用“交叉检查”来提升代码的质量不同的LLM有不同的优势要合理利用与其只让LLM反思代码但事实证明外部反馈来自LLM之外的新信息反思的效果会更加强大例子如下结合外部反馈的反思Reflection with external feedback这个图展示了反思机制的最高阶形态——引入真实的外部运行环境开始LLM 写出初版代码code V1后不再仅仅依赖另一个模型去找 Bug而是直接执行代码execute code。获得真实反馈代码运行后会产生实际的输出或报错信息例如图中的SyntaxError: unterminated string literal...语法错误。基于反馈的反思将这些真实的报错信息和初版代码一起交给 LLM。LLM 基于具体的执行错误进行反思从而精准定位并修复问题输出第二版代码。总结一句话通过“实践”来检验真理。这种利用反馈进行的方式比LLM自己反思效果要更好输出的结果质量要更高总结人类本能→\rightarrow→AI 内部自我反思→\rightarrow→多 AI 模型交叉反思→\rightarrow→基于外部真实环境反馈的反思。通过这篇文章我们不能再简单的把大模型当成一个简单的“你问我答”的聊天工具传统的直接生成而是要把它看作一个拥有“反思能力”的智能体Agent。如果这篇文章对你有帮助欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力

JAVA8之时区核心类ZoneId深度解析：从源码到实战应用

1. ZoneId基础概念与核心作用时区处理是每个Java开发者都无法回避的问题。记得我刚入行时，就曾因为时区问题导致生产环境的数据显示错误，差点酿成事故。Java 8引入的java.time包彻底改变了这一局面，而ZoneId就是这个新日期时间API的核心时区…

2026/5/27 18:11:23 阅读更多

极域电子教室破解技术深度解析：JiYuTrainer项目架构与实战指南

极域电子教室破解技术深度解析：JiYuTrainer项目架构与实战指南【免费下载链接】JiYuTrainer 极域电子教室防控制软件, StudenMain.exe 破解项目地址: https://gitcode.com/gh_mirrors/ji/JiYuTrainer JiYuTrainer是一款专门针对极域电子教室系统的反控制工…

2026/5/27 18:11:23 阅读更多

中国教育研究（香港）-收费1500-期刊-只有issn-维普收录

2026/5/27 18:10:38 阅读更多

卖漆包线怎么找客户？电机和变压器厂在哪里

卖漆包线（电磁线）找客户，本质是找用漆包线的下游工厂。这类工厂的核心特征是：自身在产、持续消耗漆包线做绕组件，而不是二次转卖。核心难点在于把这些真实在产、真实绕线的下游加工厂名单和联系人拿到手——漆包线的下…

2026/5/27 19:26:41 阅读更多

星露谷物语SMAPI模组加载器：终极免费模组管理解决方案指南

星露谷物语SMAPI模组加载器：终极免费模组管理解决方案指南【免费下载链接】SMAPI The modding API for Stardew Valley. 项目地址: https://gitcode.com/gh_mirrors/smap/SMAPI 星露谷物语SMAPI模组加载器是星露谷物语游戏的官方模组API和框架，为…

2026/5/27 19:26:41 阅读更多

如何在Obsidian中创建专业表格？终极Excel插件完全指南

如何在Obsidian中创建专业表格？终极Excel插件完全指南【免费下载链接】obsidian-excel 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-excel 还在为在笔记中处理表格数据而烦恼吗？想象一下：你正在整理研究数据，…

2026/5/27 19:26:19 阅读更多

AI 提问的艺术：从手机端到 IDE，如何精准提问获得最佳回答

1. 引言你是否遇到过这样的困惑：同样一个AI工具，别人问出来的答案精准又完整，而你问出来的却总是答非所问、泛泛而谈？其实，这背后不是AI“偏心”，而是提问的方式决定了回答的质量。就像跟一位博学的专家交…

2026/5/27 19:25:59 阅读更多

挂科/绩点低怎么救？大厂面试官其实更看重留学生简历里的这个“隐藏分区”「蒸汽求职分享」

在海外求学期间，由于不适应全英文授课节奏或专业课难度，导致一两门理论课挂科，或者平均学分绩点（GPA）在 3.0 左右徘徊，是很多应届留学生求职时的一大心病。面对竞争激烈的跨国校招，不少同学会因…

2026/5/27 19:25:59 阅读更多

如何通过Android设备伪装技术实现微信双设备登录：WeChatPad完整指南

如何通过Android设备伪装技术实现微信双设备登录：WeChatPad完整指南【免费下载链接】WeChatPad 强制使用微信平板模式项目地址: https://gitcode.com/gh_mirrors/we/WeChatPad 在数字时代，微信已成为我们生活中不可或缺的沟通工具，但…

2026/5/27 19:25:59 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/26 19:57:06 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章

JAVA8之 时区核心类ZoneId深度解析：从源码到实战应用

极域电子教室破解技术深度解析：JiYuTrainer项目架构与实战指南

中国教育研究（香港）-收费1500-期刊-只有issn-维普收录

卖漆包线怎么找客户？电机和变压器厂在哪里

星露谷物语SMAPI模组加载器：终极免费模组管理解决方案指南

如何在Obsidian中创建专业表格？终极Excel插件完全指南

AI 提问的艺术：从手机端到 IDE，如何精准提问获得最佳回答

挂科/绩点低怎么救？大厂面试官其实更看重留学生简历里的这个“隐藏分区”「蒸汽求职分享」

如何通过Android设备伪装技术实现微信双设备登录：WeChatPad完整指南

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

中国AI岗位暴涨12倍，13种你没听过的AI岗位

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

附录 B：术语表

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

JAVA8之时区核心类ZoneId深度解析：从源码到实战应用