OpenClaw 核心组件全解:Gateway、Agent、Skills、Memory 的职责与协作关系 OpenClaw 核心组件全解Gateway、Agent、Skills、Memory 的职责与协作关系1. 引言当 AI 不再“单兵作战”2. 四大核心组件全景图3. Gateway网关—— 系统的“中枢神经系统”3.1 它是什么3.2 核心职责4. Agent智能体—— 系统的“大脑”4.1 它是什么4.2 核心工作循环Agentic Loop5. Skills技能包—— 系统的“工具箱”5.1 它是什么5.2 三级加载体系6. Memory记忆—— 系统的“笔记本”6.1 它是什么6.2 存储结构6.3 混合检索7. 组件协作一条消息的完整生命周期8. 插件系统能力扩展的“第四维”8.1 公共能力模型8.2 插件形态分类9. 结语一个可运行、可扩展、可治理的 Agent 操作系统The Begin点点关注收藏不迷路⬇ ⬇ 底部 ⬇ ⬇1. 引言当 AI 不再“单兵作战”如果你拆解过任何一个现代 AI Agent 系统比如 OpenClaw你会发现它绝不是一个“大模型 聊天界面”的简单组合。真正让它能7×24 小时持续运行、跨渠道响应、记住历史、调用工具的是一套精心设计的组件体系。一句话概括OpenClaw 采用“一个网关 多个智能体 可扩展技能 本地记忆文件”的架构四个核心组件各司其职共同构成了一个可长期运行的 AI Agent 操作系统。本文将逐一拆解 Gateway、Agent、Skills、Memory 这四大核心组件并通过一条消息的完整生命周期展示它们之间如何协同工作。2. 四大核心组件全景图能力层核心层交互入口层Telegram / WhatsApp / 飞书 / 微信 / CLI / Web UIGateway 网关中枢神经系统Agent 智能体大脑Skills 技能包工具箱Memory 记忆笔记本本地系统操作文件/命令/进程浏览器自动化网页操作/截图LLM 模型层GPT/Claude/Gemini/本地模型3. Gateway网关—— 系统的“中枢神经系统”3.1 它是什么Gateway 是 OpenClaw 最常驻的后台进程默认运行在127.0.0.1:18789。它是整个系统唯一对外暴露的控制平面所有外部交互消息平台、CLI 工具、Web 界面、节点设备都通过 WebSocket 协议与 Gateway 通信。3.2 核心职责Gateway 承担着六大核心职能消息路由接收来自各通讯渠道WhatsApp、Telegram、企业微信等的消息解析后分发给对应的 Agent 会话会话管理维护多轮对话的上下文状态支持多会话并发访问控制验证消息发送者身份执行白名单/黑名单策略处理设备配对事件分发向连接的客户端CLI、Web 控制面板、移动端应用推送系统状态更新事件安全边界统一管理工具执行权限决定是否允许某次操作真正落地执行任务调度内置 Cron 系统支持定时任务的微秒级精度调度关于并发的关键设计OpenClaw 采用“串行优先”的队列模型——每个会话独立排队默认串行执行优先保证状态稳定。这个设计直接回应了 AI Agent 系统的经典问题并发越多状态越容易失控。多个执行过程同时读写同一会话很容易出现竞态和权限边界模糊。4. Agent智能体—— 系统的“大脑”4.1 它是什么Agent 是真正调用大模型进行推理、决策并执行任务的模块。如果说 Gateway 是“接客”的Agent 就是“干活”的。每个 Agent 拥有独立的身份Identity通过SOUL.md定义其人格、语气和行为风格上下文Context包含系统提示词、历史对话、技能列表、记忆文件工具集Tools可以调用的操作能力如browser_浏览器控制、exec执行命令、memory_search记忆检索4.2 核心工作循环Agentic LoopAgent 的执行遵循一个闭环循环是否接收Gateway分发的用户消息组装上下文系统提示记忆技能列表历史调用大模型推理决定“直接回复”还是“调用工具”需要调用工具执行工具将结果反馈给模型继续推理生成最终回复通过Gateway发送给用户写入记忆文件完成状态持久化5. Skills技能包—— 系统的“工具箱”5.1 它是什么Skills 是 Agent 能力的扩展机制。每个 Skill 以文件夹形式存在核心文件是SKILL.md用自然语言描述“遇到某类任务时应该怎么做”。当 Agent 在推理过程中识别到任务与某个 Skill 匹配时会读取对应的SKILL.md来获取执行指引。5.2 三级加载体系OpenClaw 2026 年 2 月的稳定版引入了三级技能加载体系内置技能Built-in Skills系统自带的通用能力本地技能Local Skills用户自定义的专属技能插件技能Plugin Skills通过插件市场安装的扩展技能开发者可以通过配置文件动态调整技能优先级例如在金融风控场景中优先加载内置的反欺诈检测技能。Skills 支持多层嵌套——一个 Skill 可以调用另一个 Skill形成复杂的工作流编排能力。6. Memory记忆—— 系统的“笔记本”6.1 它是什么Memory 模块负责将所有重要信息以 Markdown 文件形式持久化到本地磁盘。它让 Agent 不再是“每次启动都失忆”而是能跨会话积累经验。6.2 存储结构Memory 采用多层结构MEMORY.md长期记忆存放用户偏好、关键事实、学习成果memory/YYYY-MM-DD.md每日日志记录当天的交互内容6.3 混合检索在每次会话开始时Memory 模块会通过混合检索机制将相关信息加载到模型上下文中关键词搜索通过全文索引实现精确匹配向量搜索通过 Embedding 模型实现语义检索三个信息层次的设计区别上下文存在于模型当次的“思维”中记忆持久化在磁盘上而日志保留着完整的交互历史——它们共同构成了 OpenClaw 的信息存储体系。7. 组件协作一条消息的完整生命周期理解了四个组件的各自职责再来看它们如何协同工作。假设你通过 Telegram 发出一条指令“帮我总结财联社上昨天最热门的 10 条新闻并在每天早上 8 点发给我。”外部工具大模型Memory记忆Skills技能包Agent智能体Gateway网关用户(Telegram)外部工具大模型Memory记忆Skills技能包Agent智能体Gateway网关用户(Telegram)阶段1-2接入与调度阶段3上下文构建阶段4-5推理与执行继续循环(ReAct)“帮我总结财联社新闻…”渠道适配(Telegram协议→标准消息)权限校验 会话映射分发消息读取长期记忆(用户偏好)返回(偏好摘要格式、信息来源)加载系统提示 工具定义 技能列表发送完整上下文推理结果需要调用news_fetcher技能加载 news_fetcher 技能返回 SKILL.md 执行指引执行浏览器抓取返回新闻数据发送工具执行结果生成摘要 规划定时任务注册 Cron 定时任务写入当日日志发送最终回复“已生成摘要每日8点推送”这条流程清晰展示了四个组件的协作分工Gateway负责“接客”——渠道适配、权限校验、会话归属Agent负责“想和做”——上下文组装、模型推理、工具调用循环Skills负责“提供专业能力”——按需加载执行指引Memory负责“记住一切”——跨会话持久化让 Agent 越用越懂用户8. 插件系统能力扩展的“第四维”除了四大核心组件OpenClaw 还有一个同样关键的设计——插件系统它为整个框架提供了横向扩展能力。8.1 公共能力模型OpenClaw 内部采用能力注册Capability Registration模式每个原生插件通过api.registerXxxProvider(...)方法注册一项或多项能力能力类型注册方法示例插件文本推理registerProviderOpenAI, Anthropic语音识别/合成registerSpeechProviderElevenLabs, Microsoft媒体理解registerMediaUnderstandingProviderOpenAI, Google图像生成registerImageGenerationProviderOpenAI, Google, Fal渠道消息registerChannelTeams, Matrix, 飞书Web 搜索registerWebSearchProviderGoogle8.2 插件形态分类OpenClaw 会根据插件的实际注册行为将其分类为plain-capability只注册一种能力类型如仅提供文本推理的 Mistral 插件hybrid-capability注册多种能力类型如 OpenAI 插件同时支持文本推理、语音、媒体理解、图像生成hook-only只注册钩子不注册能力、工具或命令主要用于兼容旧版non-capability注册工具、命令或服务但不注册能力9. 结语一个可运行、可扩展、可治理的 Agent 操作系统OpenClaw 之所以能成为一个被全球开发者追捧的项目不是因为它发明了新的模型架构而是它把接入、调度、执行、记忆和扩展这些能力真正组织成了一套可运行的系统。四个组件的关系可以用一句话总结Gateway 是“中枢神经”——统一接收入口、控制权限Agent 是“大脑”——负责推理决策Skills 是“工具箱”——提供专业技能Memory 是“笔记本”——跨会话持久化经验。它们共同构成了一个让 AI 从“能说会道”到“真刀真枪干活”的运行框架。The End点点关注收藏不迷路⬆ ⬆ 顶部 ⬆ ⬆