Hermes Agent 架构详解

发布时间：2026/5/27 21:43:36

如果你最近也在看 Agent 框架会发现很多项目的问题不是「能不能调模型」而是消息从哪来、上下文怎么保住、工具怎么接、中途怎么停、历史怎么找回来。Hermes Agent 这篇架构拆解刚好把这些工程细节摊开了。它不是只讲一个漂亮的 Agent 循环而是把命令行、消息网关、IDE 插件、工具注册、压缩和会话存储放在同一张图里看适合想自己搭 Agent 系统的开发者细读。正文// 01先从全貌说起整个系统可以用三句话概括入口多样内核唯一功能模块化依赖松耦合状态持久化会话可恢复。无论你从命令行、Telegram、VS Code 还是 REST API 发来消息最终都由同一个AIAgent类来处理。这保证了行为一致也大大降低了维护成本。工具系统、内存插件、上下文引擎都是注册制——可以随时插拔不需要修改核心代码。// 02Agent 循环心跳一直在跳如果说整个系统是一台机器Agent 循环Agent Loop就是它的心跳。每当用户发来一条消息AIAgent.run_conversation()就开始一轮循环。**可中断的 API 调用**HTTP 请求在后台线程运行主线程同时监听中断信号。用户发来/stop或新消息时当前请求被丢弃Agent 干净地响应新输入——不会有回答到一半的脏数据写入历史。**Fallback 兜底**主模型报 429、5xx 或鉴权错误时系统自动按配置顺序尝试备用服务商整个对话不中断。辅助任务视觉理解、压缩摘要也有独立的备用链。// 03Prompt 组装系统提示词是怎么搭起来的Hermes 把系统提示词拆成多个稳定层在会话开始时一次性组装好此后不再改动。核心原因是Prompt Cache 成本——稳定的前缀可将 token 费用降低约 75%。上下文文件优先级仅加载第一个命中的1st · .hermes.md / HERMES.md2nd · AGENTS.md3rd · CLAUDE.md4th · .cursorrules记忆快照的微妙之处MEMORY.md 在会话开始时冻结进 Prompt。如果会话中途通过memory工具写入了新内容它会实时写到磁盘但不会改变当前会话的系统提示词——要等下一个会话才能看到新记忆。这防止了改动 Prompt 导致缓存全部失效的问题。// 04上下文压缩与缓存长对话不失忆处理复杂任务时对话往往很长——一个重构大型代码库的任务可能产生几十轮工具调用消耗数万 token。Hermes 的解法是双层压缩系统加 Anthropic Prompt Cache。压缩算法四个阶段PHASE 01清除旧工具输出无 LLM 调用直接替换超过 200 字符的旧工具结果为占位符最廉价的降本手段PHASE 02确定保护边界头部保留 3 条尾部按 token 预算保留最近 N 条至少 20 条中间段将被摘要PHASE 03LLM 生成结构化摘要辅助 LLM 将中间段压缩为目标→进度→决策→相关文件→下一步的结构化摘要PHASE 04拼接并清理组合头部摘要尾部修复孤儿 tool_call/tool_result 对生成子会话 ID压缩后的实际效果45 条消息 95K token → 压缩后 25 条 45K token关键进度和决策完整保留。再次压缩时旧摘要会被更新而非重写已完成的任务从进行中移到已完成信息不丢失地迭代积累。**Prompt Caching 策略仅限 Anthropic**Hermes 在系统提示词和最近 3 条消息上各放置一个 cache breakpoint共 4 个达到 Anthropic 的上限使多轮对话的输入 token 成本降低约 75%。// 05消息网关一个 Agent接入 20 平台Hermes 有一个长期运行的消息网关进程负责对接各种通讯平台。无论是 Telegram 群组消息、Discord 提及还是企业微信工单都会被规范化成内部MessageEvent交由同一个 AIAgent 处理。两级消息保护当 Agent 正在处理一条消息时用户发来第二条会被暂时排队。/stop、/approve、/deny等控制命令可以插队直接到达 Agent其他消息则等待。这防止了并发竞争导致的历史记录混乱。DM 配对授权管理员用/pair生成一次性配对码新用户发送这个码就能获得授权无需修改任何配置文件——适合快速将新用户引入 Agent。// 06工具系统Agent 的手工具是 Agent 执行能力的载体。Hermes 内置 70 工具分成约 28 个工具集从文件读写、终端命令到浏览器自动化一应俱全。自动注册机制每个工具文件的底部只需一行注册调用启动时自动被发现无需手动维护列表# tools/file_tools.py 末尾registry.register(read_file, read_file_handler, schemaREAD_FILE_SCHEMA)# tools/web_tools.py 末尾registry.register(web_search, web_search_handler, schemaWEB_SEARCH_SCHEMA)整个注册链路如下tools/registry.py # 基础模块无依赖最先加载 ↑tools/*.py # 各自在 import 时调用 registry.register() ↑model_tools.py # 汇总 schema处理 handle_function_call() 分发 ↑run_agent.py # 使用工具列表构造 LLM API 请求终端工具支持 7 种后端本地 shellDocker 容器SSH 远程DaytonaModalSingularityVercel Sandbox切换执行环境只需改配置工具调用代码不变。同时MCPModel Context Protocol工具得到原生支持——挂载任意 MCP 服务后Hermes 在运行时动态加载其暴露的工具无需重启。// 07会话存储记住每一次交流Hermes 用 SQLite FTS5 做会话持久化。FTS5 是 SQLite 的全文检索扩展让session_search工具能在历史会话中快速检索关键词——Agent 在开始新任务前可以主动回忆相关背景。会话血缘追踪Lineage每次压缩会生成一个子会话记录从哪个父会话压缩而来。这让你可以追溯一个长任务的完整历史即便中途经过多次压缩。Profile 隔离每个 profile如hermes -p dev、hermes -p work拥有独立的HERMES_HOME包含独立的配置、记忆、会话和网关进程。多个 profile 可以同时运行互不干扰——比如一个挂着 Telegram Bot另一个跑着 IDE 插件。// 08设计哲学总结读完这些子系统可以提炼出 Hermes 背后的六条核心设计原则——它们相互支撑共同造就了在复杂长任务场景下依然稳定可靠的 Agent 框架。原则具体体现Prompt 稳定性系统提示词在会话内不变最大化 Anthropic Prompt Cache 命中率降低约 75% 输入 token 成本可观测执行每次工具调用都通过 callback 实时反馈给用户CLI 显示 spinner网关发送进度消息可中断API 调用和工具执行均可被用户随时取消不留脏数据新消息优先处理平台无关核心同一个 AIAgent 类服务 CLI、消息网关、ACP IDE 插件、批处理和 API Server平台差异在入口层处理松耦合MCP、插件、内存提供者、RL 环境均为注册制和 check_fn 门控非强依赖可按需启用Profile 隔离每个 profile 有独立的 HERMES_HOME、配置、记忆、会话、网关进程多实例并行互不干扰AI灰鲸更建议把这篇当成一份 Agent 工程设计清单而不是单纯的项目介绍。真正做过长任务 Agent 的人都知道模型调用只是最显眼的一层后面更磨人的其实是缓存命中、可中断执行、工具结果膨胀、消息并发和多平台会话隔离。Hermes 的价值在于它把这些「上线以后才会疼」的问题前置成架构约束。你不一定要照搬它的实现但这些模块边界很值得抄作业。尤其是 Prompt 稳定性、两层压缩和 profile 隔离这几块放到任何企业内部 Agent 或开发者自动化助手里都是迟早要面对的坑。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

如何高效集成开源英汉词典数据库：ECDICT完整技术实践指南

如何高效集成开源英汉词典数据库：ECDICT完整技术实践指南【免费下载链接】ECDICT Free English to Chinese Dictionary Database 项目地址: https://gitcode.com/gh_mirrors/ec/ECDICT ECDICT是一个功能强大的免费开源英汉词典数据库，为开发者提…

2026/5/27 21:43:36 阅读更多

避坑指南：PVE显卡直通后，你的Ubuntu 22.04 AI虚拟机为何识别不到GPU？

避坑指南：PVE显卡直通后，你的Ubuntu 22.04 AI虚拟机为何识别不到GPU？当你按照教程一步步完成PVE显卡直通配置，满怀期待地启动Ubuntu 22.04虚拟机准备大展拳脚时，却发现nvidia-smi命令返回一片空白——这种挫败感我深有…

2026/5/27 21:42:34 阅读更多

一个AI从业者的持续学习法：每年考一个进阶认证当锚点

2026 年做 AI，最怕的不是“不会用某个工具”，而是学习一直停留在碎片化：今天收藏提示词，明天追一个 Agent 框架，后天又被新模型刷屏。学了很多，却很难说清自己到底进步在哪里。更稳的办法，是给…

2026/5/27 21:42:34 阅读更多

OFDM-CVQKD：面向太赫兹无线量子通信的协议原理与性能分析

1. 项目概述：当量子密钥分发遇上太赫兹与OFDM在量子通信这个前沿领域，安全与效率的博弈从未停止。传统的量子密钥分发（QKD）协议，无论是基于单光子的离散变量（DV）方案，还是基于光场正…

2026/5/27 22:59:30 阅读更多

Arco AI —— 深度嵌入 Odoo 18 的 AI 中枢。

Arco AI - 让 Odoo 拥有AI 大脑

2026/5/27 22:59:30 阅读更多

【故障诊断】最大二阶循环平稳盲反卷积（CYCBD）在滚动体轴承故障诊断中的应用附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长毕业设计辅导、数学建模、数据处理、程序设计科研仿真。🍎完整代码获取定制创新论文复现点击：Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f3…

2026/5/27 22:58:49 阅读更多

如何快速掌握围棋AI分析：LizzieYzy从入门到精通的完整指南

如何快速掌握围棋AI分析：LizzieYzy从入门到精通的完整指南【免费下载链接】lizzieyzy LizzieYzy - GUI for Game of Go 项目地址: https://gitcode.com/gh_mirrors/li/lizzieyzy 你是否还在为复盘时找不到自己的失误而苦恼？想知道职业棋手是如何…

2026/5/27 22:57:48 阅读更多

当边缘AI遇上光网建设：预测式熔接控制如何挑战传统算法？

编者注： 本文技术描述主要来源于灼识科技的产品资料，部分核心性能数据（标注"待第三方验证"处）尚未获得独立机构的公开实测支持，读者在引用时请结合自身场景评估。2026年，生成式AI、多模态大模型颠…

2026/5/27 22:57:08 阅读更多

深入理解 RAG 技术原理：检索生成

本文聚焦 RAG 的第二阶段——检索生成。这是用户提问时实时发生的链路：接收用户问题、检索相关知识、将知识注入上下文、生成最终答案。每一步都有大量优化空间。一、查询改写（Query Rewriting） 用户的原始问题往往不是最佳检索查询。在将问…

2026/5/27 22:57:08 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/27 3:41:47 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/27 3:04:04 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/27 2:28:22 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/27 20:16:23 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/27 15:51:09 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/27 12:55:08 阅读更多

相关文章