// 01先从全貌说起整个系统可以用三句话概括入口多样内核唯一功能模块化依赖松耦合状态持久化会话可恢复。无论你从命令行、Telegram、VS Code 还是 REST API 发来消息最终都由同一个AIAgent类来处理。这保证了行为一致也大大降低了维护成本。工具系统、内存插件、上下文引擎都是注册制——可以随时插拔不需要修改核心代码。// 02Agent 循环心跳一直在跳如果说整个系统是一台机器Agent 循环Agent Loop就是它的心跳。每当用户发来一条消息AIAgent.run_conversation()就开始一轮循环。**可中断的 API 调用**HTTP 请求在后台线程运行主线程同时监听中断信号。用户发来/stop或新消息时当前请求被丢弃Agent 干净地响应新输入——不会有回答到一半的脏数据写入历史。**Fallback 兜底**主模型报 429、5xx 或鉴权错误时系统自动按配置顺序尝试备用服务商整个对话不中断。辅助任务视觉理解、压缩摘要也有独立的备用链。// 03Prompt 组装系统提示词是怎么搭起来的Hermes 把系统提示词拆成多个稳定层在会话开始时一次性组装好此后不再改动。核心原因是Prompt Cache 成本——稳定的前缀可将 token 费用降低约 75%。上下文文件优先级仅加载第一个命中的1st · .hermes.md / HERMES.md2nd · AGENTS.md3rd · CLAUDE.md4th · .cursorrules记忆快照的微妙之处MEMORY.md 在会话开始时冻结进 Prompt。如果会话中途通过memory工具写入了新内容它会实时写到磁盘但不会改变当前会话的系统提示词——要等下一个会话才能看到新记忆。这防止了改动 Prompt 导致缓存全部失效的问题。// 04上下文压缩与缓存长对话不失忆处理复杂任务时对话往往很长——一个重构大型代码库的任务可能产生几十轮工具调用消耗数万 token。Hermes 的解法是双层压缩系统加 Anthropic Prompt Cache。压缩算法四个阶段PHASE 01清除旧工具输出无 LLM 调用直接替换超过 200 字符的旧工具结果为占位符最廉价的降本手段PHASE 02确定保护边界头部保留 3 条尾部按 token 预算保留最近 N 条至少 20 条中间段将被摘要PHASE 03LLM 生成结构化摘要辅助 LLM 将中间段压缩为目标→进度→决策→相关文件→下一步的结构化摘要PHASE 04拼接并清理组合头部摘要尾部修复孤儿 tool_call/tool_result 对生成子会话 ID压缩后的实际效果45 条消息 95K token → 压缩后 25 条 45K token关键进度和决策完整保留。再次压缩时旧摘要会被更新而非重写已完成的任务从进行中移到已完成信息不丢失地迭代积累。**Prompt Caching 策略仅限 Anthropic**Hermes 在系统提示词和最近 3 条消息上各放置一个 cache breakpoint共 4 个达到 Anthropic 的上限使多轮对话的输入 token 成本降低约 75%。// 05消息网关一个 Agent接入 20 平台Hermes 有一个长期运行的消息网关进程负责对接各种通讯平台。无论是 Telegram 群组消息、Discord 提及还是企业微信工单都会被规范化成内部MessageEvent交由同一个 AIAgent 处理。两级消息保护当 Agent 正在处理一条消息时用户发来第二条会被暂时排队。/stop、/approve、/deny等控制命令可以插队直接到达 Agent其他消息则等待。这防止了并发竞争导致的历史记录混乱。DM 配对授权管理员用/pair生成一次性配对码新用户发送这个码就能获得授权无需修改任何配置文件——适合快速将新用户引入 Agent。// 06工具系统Agent 的手工具是 Agent 执行能力的载体。Hermes 内置 70 工具分成约 28 个工具集从文件读写、终端命令到浏览器自动化一应俱全。自动注册机制每个工具文件的底部只需一行注册调用启动时自动被发现无需手动维护列表# tools/file_tools.py 末尾registry.register(read_file, read_file_handler, schemaREAD_FILE_SCHEMA)# tools/web_tools.py 末尾registry.register(web_search, web_search_handler, schemaWEB_SEARCH_SCHEMA)整个注册链路如下tools/registry.py # 基础模块无依赖最先加载 ↑tools/*.py # 各自在 import 时调用 registry.register() ↑model_tools.py # 汇总 schema处理 handle_function_call() 分发 ↑run_agent.py # 使用工具列表构造 LLM API 请求终端工具支持 7 种后端本地 shellDocker 容器SSH 远程DaytonaModalSingularityVercel Sandbox切换执行环境只需改配置工具调用代码不变。同时MCPModel Context Protocol工具得到原生支持——挂载任意 MCP 服务后Hermes 在运行时动态加载其暴露的工具无需重启。// 07会话存储记住每一次交流Hermes 用 SQLite FTS5 做会话持久化。FTS5 是 SQLite 的全文检索扩展让session_search工具能在历史会话中快速检索关键词——Agent 在开始新任务前可以主动回忆相关背景。会话血缘追踪Lineage每次压缩会生成一个子会话记录从哪个父会话压缩而来。这让你可以追溯一个长任务的完整历史即便中途经过多次压缩。Profile 隔离每个 profile如hermes -p dev、hermes -p work拥有独立的HERMES_HOME包含独立的配置、记忆、会话和网关进程。多个 profile 可以同时运行互不干扰——比如一个挂着 Telegram Bot另一个跑着 IDE 插件。// 08设计哲学总结读完这些子系统可以提炼出 Hermes 背后的六条核心设计原则——它们相互支撑共同造就了在复杂长任务场景下依然稳定可靠的 Agent 框架。原则具体体现Prompt 稳定性系统提示词在会话内不变最大化 Anthropic Prompt Cache 命中率降低约 75% 输入 token 成本可观测执行每次工具调用都通过 callback 实时反馈给用户CLI 显示 spinner网关发送进度消息可中断API 调用和工具执行均可被用户随时取消不留脏数据新消息优先处理平台无关核心同一个 AIAgent 类服务 CLI、消息网关、ACP IDE 插件、批处理和 API Server平台差异在入口层处理松耦合MCP、插件、内存提供者、RL 环境均为注册制和 check_fn 门控非强依赖可按需启用Profile 隔离每个 profile 有独立的 HERMES_HOME、配置、记忆、会话、网关进程多实例并行互不干扰2026年AI行业最大的机会毫无疑问就在应用层字节跳动已有7个团队全速布局Agent大模型岗位暴增69%年薪破百万腾讯、京东、百度开放招聘技术岗80%与AI相关……如今超过60%的企业都在推进AI产品落地而真正能交付项目的大模型应用开发工程师****却极度稀缺落地AI应用绝对不是写几个prompt调几个API就能搞定的企业真正需要的是能搞定这三项核心能力的人✅RAG融入外部信息修正模型输出给模型装靠谱大脑✅Agent智能体让AI自主干活通过工具调用Tools环境交互多步推理完成复杂任务。比如做智能客服等等……✅微调针对特定任务优化让模型适配业务目前脉脉上有超过1000家企业发布大模型相关岗位人工智能岗平均月薪7.8w实习生日薪高达4000远超其他行业收入水平技术的稀缺性才是你「值钱」的关键具备AI能力的程序员比传统开发高出不止一截有的人早就转行AI方向拿到百万年薪AI浪潮正在重构程序员的核心竞争力现在入场仍是最佳时机我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】⭐️从大模型微调到AI Agent智能体搭建剖析AI技术的应用场景用实战经验落地AI技术。从GPT到最火的开源模型让你从容面对AI技术革新大模型微调掌握主流大模型如DeepSeek、Qwen等的微调技术针对特定场景优化模型性能。学习如何利用领域数据如制造、医药、金融等进行模型定制提升任务准确性和效率。RAG应用开发深入理解检索增强生成Retrieval-Augmented Generation, RAG技术构建高效的知识检索与生成系统。应用于垂类场景如法律文档分析、医疗诊断辅助、金融报告生成等实现精准信息提取与内容生成。AI Agent智能体搭建学习如何设计和开发AI Agent实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等。如果你也有以下诉求快速链接产品/业务团队参与前沿项目构建技术壁垒从竞争者中脱颖而出避开35岁裁员危险期顺利拿下高薪岗迭代技术水平延长未来20年的新职业发展……那这节课你一定要来听因为留给普通程序员的时间真的不多了立即扫码即可免费预约「AI技术原理 实战应用 职业发展」「大模型应用开发实战公开课」还有靠谱的内推机会直聘权益完课后赠送大模型应用案例集、AI商业落地白皮书
Hermes Agent 架构深度解析:解锁复杂长任务 Agent 的工程密码!
发布时间:2026/5/26 21:43:46
// 01先从全貌说起整个系统可以用三句话概括入口多样内核唯一功能模块化依赖松耦合状态持久化会话可恢复。无论你从命令行、Telegram、VS Code 还是 REST API 发来消息最终都由同一个AIAgent类来处理。这保证了行为一致也大大降低了维护成本。工具系统、内存插件、上下文引擎都是注册制——可以随时插拔不需要修改核心代码。// 02Agent 循环心跳一直在跳如果说整个系统是一台机器Agent 循环Agent Loop就是它的心跳。每当用户发来一条消息AIAgent.run_conversation()就开始一轮循环。**可中断的 API 调用**HTTP 请求在后台线程运行主线程同时监听中断信号。用户发来/stop或新消息时当前请求被丢弃Agent 干净地响应新输入——不会有回答到一半的脏数据写入历史。**Fallback 兜底**主模型报 429、5xx 或鉴权错误时系统自动按配置顺序尝试备用服务商整个对话不中断。辅助任务视觉理解、压缩摘要也有独立的备用链。// 03Prompt 组装系统提示词是怎么搭起来的Hermes 把系统提示词拆成多个稳定层在会话开始时一次性组装好此后不再改动。核心原因是Prompt Cache 成本——稳定的前缀可将 token 费用降低约 75%。上下文文件优先级仅加载第一个命中的1st · .hermes.md / HERMES.md2nd · AGENTS.md3rd · CLAUDE.md4th · .cursorrules记忆快照的微妙之处MEMORY.md 在会话开始时冻结进 Prompt。如果会话中途通过memory工具写入了新内容它会实时写到磁盘但不会改变当前会话的系统提示词——要等下一个会话才能看到新记忆。这防止了改动 Prompt 导致缓存全部失效的问题。// 04上下文压缩与缓存长对话不失忆处理复杂任务时对话往往很长——一个重构大型代码库的任务可能产生几十轮工具调用消耗数万 token。Hermes 的解法是双层压缩系统加 Anthropic Prompt Cache。压缩算法四个阶段PHASE 01清除旧工具输出无 LLM 调用直接替换超过 200 字符的旧工具结果为占位符最廉价的降本手段PHASE 02确定保护边界头部保留 3 条尾部按 token 预算保留最近 N 条至少 20 条中间段将被摘要PHASE 03LLM 生成结构化摘要辅助 LLM 将中间段压缩为目标→进度→决策→相关文件→下一步的结构化摘要PHASE 04拼接并清理组合头部摘要尾部修复孤儿 tool_call/tool_result 对生成子会话 ID压缩后的实际效果45 条消息 95K token → 压缩后 25 条 45K token关键进度和决策完整保留。再次压缩时旧摘要会被更新而非重写已完成的任务从进行中移到已完成信息不丢失地迭代积累。**Prompt Caching 策略仅限 Anthropic**Hermes 在系统提示词和最近 3 条消息上各放置一个 cache breakpoint共 4 个达到 Anthropic 的上限使多轮对话的输入 token 成本降低约 75%。// 05消息网关一个 Agent接入 20 平台Hermes 有一个长期运行的消息网关进程负责对接各种通讯平台。无论是 Telegram 群组消息、Discord 提及还是企业微信工单都会被规范化成内部MessageEvent交由同一个 AIAgent 处理。两级消息保护当 Agent 正在处理一条消息时用户发来第二条会被暂时排队。/stop、/approve、/deny等控制命令可以插队直接到达 Agent其他消息则等待。这防止了并发竞争导致的历史记录混乱。DM 配对授权管理员用/pair生成一次性配对码新用户发送这个码就能获得授权无需修改任何配置文件——适合快速将新用户引入 Agent。// 06工具系统Agent 的手工具是 Agent 执行能力的载体。Hermes 内置 70 工具分成约 28 个工具集从文件读写、终端命令到浏览器自动化一应俱全。自动注册机制每个工具文件的底部只需一行注册调用启动时自动被发现无需手动维护列表# tools/file_tools.py 末尾registry.register(read_file, read_file_handler, schemaREAD_FILE_SCHEMA)# tools/web_tools.py 末尾registry.register(web_search, web_search_handler, schemaWEB_SEARCH_SCHEMA)整个注册链路如下tools/registry.py # 基础模块无依赖最先加载 ↑tools/*.py # 各自在 import 时调用 registry.register() ↑model_tools.py # 汇总 schema处理 handle_function_call() 分发 ↑run_agent.py # 使用工具列表构造 LLM API 请求终端工具支持 7 种后端本地 shellDocker 容器SSH 远程DaytonaModalSingularityVercel Sandbox切换执行环境只需改配置工具调用代码不变。同时MCPModel Context Protocol工具得到原生支持——挂载任意 MCP 服务后Hermes 在运行时动态加载其暴露的工具无需重启。// 07会话存储记住每一次交流Hermes 用 SQLite FTS5 做会话持久化。FTS5 是 SQLite 的全文检索扩展让session_search工具能在历史会话中快速检索关键词——Agent 在开始新任务前可以主动回忆相关背景。会话血缘追踪Lineage每次压缩会生成一个子会话记录从哪个父会话压缩而来。这让你可以追溯一个长任务的完整历史即便中途经过多次压缩。Profile 隔离每个 profile如hermes -p dev、hermes -p work拥有独立的HERMES_HOME包含独立的配置、记忆、会话和网关进程。多个 profile 可以同时运行互不干扰——比如一个挂着 Telegram Bot另一个跑着 IDE 插件。// 08设计哲学总结读完这些子系统可以提炼出 Hermes 背后的六条核心设计原则——它们相互支撑共同造就了在复杂长任务场景下依然稳定可靠的 Agent 框架。原则具体体现Prompt 稳定性系统提示词在会话内不变最大化 Anthropic Prompt Cache 命中率降低约 75% 输入 token 成本可观测执行每次工具调用都通过 callback 实时反馈给用户CLI 显示 spinner网关发送进度消息可中断API 调用和工具执行均可被用户随时取消不留脏数据新消息优先处理平台无关核心同一个 AIAgent 类服务 CLI、消息网关、ACP IDE 插件、批处理和 API Server平台差异在入口层处理松耦合MCP、插件、内存提供者、RL 环境均为注册制和 check_fn 门控非强依赖可按需启用Profile 隔离每个 profile 有独立的 HERMES_HOME、配置、记忆、会话、网关进程多实例并行互不干扰2026年AI行业最大的机会毫无疑问就在应用层字节跳动已有7个团队全速布局Agent大模型岗位暴增69%年薪破百万腾讯、京东、百度开放招聘技术岗80%与AI相关……如今超过60%的企业都在推进AI产品落地而真正能交付项目的大模型应用开发工程师****却极度稀缺落地AI应用绝对不是写几个prompt调几个API就能搞定的企业真正需要的是能搞定这三项核心能力的人✅RAG融入外部信息修正模型输出给模型装靠谱大脑✅Agent智能体让AI自主干活通过工具调用Tools环境交互多步推理完成复杂任务。比如做智能客服等等……✅微调针对特定任务优化让模型适配业务目前脉脉上有超过1000家企业发布大模型相关岗位人工智能岗平均月薪7.8w实习生日薪高达4000远超其他行业收入水平技术的稀缺性才是你「值钱」的关键具备AI能力的程序员比传统开发高出不止一截有的人早就转行AI方向拿到百万年薪AI浪潮正在重构程序员的核心竞争力现在入场仍是最佳时机我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】⭐️从大模型微调到AI Agent智能体搭建剖析AI技术的应用场景用实战经验落地AI技术。从GPT到最火的开源模型让你从容面对AI技术革新大模型微调掌握主流大模型如DeepSeek、Qwen等的微调技术针对特定场景优化模型性能。学习如何利用领域数据如制造、医药、金融等进行模型定制提升任务准确性和效率。RAG应用开发深入理解检索增强生成Retrieval-Augmented Generation, RAG技术构建高效的知识检索与生成系统。应用于垂类场景如法律文档分析、医疗诊断辅助、金融报告生成等实现精准信息提取与内容生成。AI Agent智能体搭建学习如何设计和开发AI Agent实现多任务协同、自主决策和复杂问题解决。构建垂类场景下的智能助手如制造业中的设备故障诊断Agent、金融领域的投资分析Agent等。如果你也有以下诉求快速链接产品/业务团队参与前沿项目构建技术壁垒从竞争者中脱颖而出避开35岁裁员危险期顺利拿下高薪岗迭代技术水平延长未来20年的新职业发展……那这节课你一定要来听因为留给普通程序员的时间真的不多了立即扫码即可免费预约「AI技术原理 实战应用 职业发展」「大模型应用开发实战公开课」还有靠谱的内推机会直聘权益完课后赠送大模型应用案例集、AI商业落地白皮书