OpenCoworkAI安装、使用方法详细全解数据来源: GitHub API、项目官方文档、第三方评测仓库地址: https://github.com/OpenCoworkAI/open-cowork一、项目概览1.1 基本介绍Open Cowork 是一款免费开源的 AI Agent 桌面应用定位为 Claude Cowork 的开源替代实现。它将 Claude Code、OpenAI、Gemini、DeepSeek 等多种 AI 模型封装为图形界面提供一键安装无需编程或终端知识即可使用。核心理念: 让每个人都能轻松使用 AI 驱动的桌面自动化。1.2 关键指标指标数值开源协议MIT主要语言TypeScript仓库大小~77.6 MB创建时间2026-01-13社区Discord 微信群1.3 一句话总结Open Cowork 是基于 Electron Claude Agent SDK 构建的桌面 AI Agent 应用支持多模型、MCP 连接器、Skills 技能系统、VM 沙盒隔离、GUI 自动化和远程协作是 Claude Cowork 的开源增强版。二、竞品对比特性Claude CoworkOpenClawOpen CoworkMCP Skills✓✓✓远程控制✗✓✓GUI 操作✗✗✓多模型支持✗ (仅 Claude)部分✓ (广泛)VM 沙盒隔离✓部分✓ (WSL2/Lima)开源✗✓✓收费订阅制免费免费 (仅付 API 费)三、核心特性详解3.1 一键安装提供 Windows (.exe) 和 macOS (.dmg) 预构建安装包支持 Homebrew 一键安装无需配置 Node.js / Python 环境3.2 多模型支持支持以下 AI 服务商和模型:服务商Base URL推荐模型OpenRouterhttps://openrouter.ai/apiclaude-4-5-sonnetAnthropic(默认)claude-4-5-sonnet智谱 AI (GLM)https://open.bigmodel.cn/api/anthropicglm-4.7,glm-4.6MiniMaxhttps://api.minimaxi.com/anthropicminimax-m2Kimihttps://api.kimi.com/coding/kimi-k2OpenAI 兼容自定义任意兼容模型GeminiGoogle 官方gemini-3-pro(推荐用于 GUI 操作)DeepSeek官方 API多种模型Qwen通义千问 API多种模型Ollama本地部署任意本地模型GrokxAI API多种模型底层架构: v3.0 移除代理层所有请求通过 Claude Agent SDK 直连采用 SDK-first 架构。3.3 虚拟机级别沙盒隔离三级安全保护:级别平台技术说明基础全平台路径守卫文件操作限制在工作区文件夹内增强WindowsWSL2命令在隔离的 Linux 虚拟机中执行增强macOSLima命令在隔离的 Ubuntu 虚拟机中执行沙盒代码模块:sandbox-adapter.ts- 沙盒适配器抽象wsl-bridge.ts/wsl-agent/- WSL2 通信桥lima-bridge.ts/lima-agent/- Lima 通信桥path-guard.ts/path-resolver.ts- 路径安全守卫sandbox-bootstrap.ts/sandbox-sync.ts- 初始化和同步native-executor.ts- 回退模式下的本地执行器path-containment.ts- 路径包含检查3.4 Skills 技能系统内置 5 个 Skills位于.claude/skills/目录:Skill功能pptxPowerPoint 演示文稿生成docxWord 文档处理pdfPDF 处理与表单xlsxExcel 电子表格生成skill-creator自定义技能开发工具包特性:支持热重载hot-reload用户可添加自定义 Skill通过skill-creator工具创建新 SkillSkills 管理模块位于src/main/skills/skills-manager.ts3.5 MCP (Model Context Protocol) 连接器MCP 让 AI 能连接外部工具和服务。Open Cowork 支持三种传输方式:传输方式说明stdio标准输入/输出 (本地进程)SSEServer-Sent Events (事件流)Streamable HTTP可流式化的 HTTP 连接MCP 代码模块:mcp-manager.ts- MCP 服务器生命周期管理mcp-config-store.ts- MCP 配置持久化mcp-oauth.ts- OAuth 认证支持mcp-logger.ts- MCP 日志记录gui-operate-server.ts- GUI 操作服务器 (6884 行)支持的 MCP 连接器: 浏览器、Notion、自定义应用等3.6 GUI 自动化操作可控制和操作桌面 GUI 应用程序屏幕截图 鼠标/键盘控制推荐模型:Gemini-3-Pro最佳 GUI 理解能力v3.2.0 新增 Windows 桌面应用自动化含微信工作流演示底层的gui-operate-server.ts实现了完整的 GUI 操作引擎3.7 远程控制平台状态飞书 (Lark)已支持含配对模式和审批面板Slack已支持远程控制代码模块:remote-manager.ts- 远程连接管理remote-config-store.ts- 远程配置存储gateway.ts- 消息网关message-router.ts- 消息路由tunnel-manager.ts- 隧道管理基于 ngrokchannels/- 多通道支持3.8 其他核心特性多模态输入: 拖拽文件和图片到聊天框实时追踪: Trace Panel 观察 AI 推理和工具调用会话管理: SQLite 持久化会话历史内存管理: 统一存储、核心/经验记忆、源感知检索国际化: 中英文界面i18next实时日志: 日志轮转和查看器四、技术架构4.1 技术栈层次技术桌面框架Electron ^35.7.5前端框架React ^18.3.1 React DOM状态管理Zustand ^5.0.12构建工具Vite ^7.3.1CSSTailwind CSS ^3.4.16 PostCSS语言TypeScript ^5.3.3 (strict mode)数据库better-sqlite3 ^12.8.0国际化i18next ^25.10.1测试Vitest ^4.1.0代码格式ESLint ^8.56.0 Prettier ^3.8.3AI SDKanthropic-ai/sdk ^0.39.0, mariozechner/pi-coding-agent ^0.60.0MCP SDKmodelcontextprotocol/sdk ^1.26.0飞书 SDKlarksuiteoapi/node-sdk ^1.59.0Slack SDKslack/bolt 4.7.0, slack/web-api 7.15.1数学渲染KaTeX ^0.16.45Markdownreact-markdown remark-gfm rehype-katex远程隧道ngrok ^5.0.0-beta.2Node.js 版本要求: 224.2 项目目录结构open-cowork/ ├── src/ │ ├── main/ # Electron 主进程 (Node.js) │ │ ├── index.ts # 主入口 │ │ ├── claude/ # AI Agent 执行 │ │ │ ├── agent-runner.ts # Agent 执行逻辑 (124KB) │ │ │ ├── agent-runner-loop-guard.ts # 循环保护 │ │ │ ├── agent-runner-message-end.ts # 消息结束处理 │ │ │ ├── claude-sdk-one-shot.ts # SDK 一次性调用 │ │ │ ├── pi-model-resolution.ts # 多模型解析 │ │ │ ├── pi-session-runtime.ts # 会话运行时 │ │ │ ├── shared-auth.ts # 共享认证 │ │ │ ├── think-tag-parser.ts # 思考标签解析 │ │ │ ├── tool-result-utils.ts # 工具结果处理 │ │ │ └── windows-bash-operations.ts # Windows Bash 操作 │ │ ├── config/ # 配置管理 (electron-store) │ │ ├── db/ # SQLite 数据库 │ │ ├── ipc/ # IPC 处理器 │ │ ├── memory/ # 内存管理 │ │ ├── sandbox/ # 沙盒与路径解析 │ │ │ ├── wsl-agent/ # WSL2 Agent │ │ │ ├── lima-agent/ # Lima Agent │ │ │ ├── wsl-bridge.ts │ │ │ ├── lima-bridge.ts │ │ │ ├── path-guard.ts │ │ │ └── ... │ │ ├── session/ # 会话管理 │ │ ├── skills/ # Skills 加载与管理 │ │ ├── tools/ # 工具执行 │ │ │ ├── tool-executor.ts │ │ │ ├── sandbox-tool-executor.ts │ │ │ └── path-containment.ts │ │ ├── mcp/ # MCP 连接器 │ │ │ ├── mcp-manager.ts │ │ │ ├── mcp-oauth.ts │ │ │ ├── mcp-config-store.ts │ │ │ ├── mcp-logger.ts │ │ │ └── gui-operate-server.ts │ │ ├── remote/ # 远程控制 (飞书/Slack) │ │ │ ├── remote-manager.ts │ │ │ ├── gateway.ts │ │ │ ├── message-router.ts │ │ │ ├── tunnel-manager.ts │ │ │ └── channels/ │ │ └── schedule/ # 定时任务 │ ├── preload/ # Electron 预加载脚本 │ └── renderer/ # React 前端 UI │ ├── components/ # UI 组件 │ │ ├── ChatView.tsx # 主聊天界面 │ │ ├── ConfigModal.tsx # 设置对话框 │ │ ├── ContextPanel.tsx # 文件上下文 │ │ ├── MessageCard.tsx # 消息卡片 │ │ ├── PermissionDialog.tsx │ │ ├── Sidebar.tsx # 侧边栏 │ │ ├── Titlebar.tsx # 自定义标题栏 │ │ ├── TracePanel.tsx # 推理追踪面板 │ │ └── WelcomeView.tsx # 欢迎页 │ ├── hooks/ # React Hooks │ ├── store/ # Zustand 状态 │ ├── i18n/ # 国际化 │ ├── styles/ # Tailwind CSS │ ├── types/ # TypeScript 类型 │ └── utils/ # 工具函数 ├── .claude/ │ └── skills/ # 默认技能 │ ├── pptx/ │ ├── docx/ │ ├── pdf/ │ ├── xlsx/ │ └── skill-creator/ ├── docs/ # 文档 ├── resources/ # 静态资源 ├── scripts/ # 构建脚本 ├── patches/ # patch-package 补丁 ├── tests/ # 测试文件 ├── website/ # 官网 (VitePress) ├── electron-builder.yml # Electron 构建配置 ├── vite.config.ts # Vite 配置 ├── tailwind.config.js # Tailwind 配置 └── package.json4.3 核心工作流程用户输入 → ChatView → IPC → Agent Runner ↓ Claude SDK / PI SDK ↓ ┌───────────┼───────────┐ ↓ ↓ ↓ MCP 工具 Skills 文件系统 ↓ 浏览器/Notion 文档生成 沙盒读写 ↓ 结果 → Trace Panel → 用户界面五、安装与配置详细步骤5.1 方式一Homebrew 安装macOS 推荐# 添加 Open Cowork 的 Homebrew tapbrew tap OpenCoworkAI/tap# 安装 Open Cowork跳过 Gatekeeper 验证brewinstall--cask--no-quarantine open-cowork--no-quarantine标志绕过 macOS Gatekeeper不会出现Apple 无法验证此应用警告。后续更新:brew upgrade--caskopen-cowork5.2 方式二下载安装包步骤:访问 Release 页面: https://github.com/OpenCoworkAI/open-cowork/releases下载对应平台的安装包:Windows:Open.Cowork-3.3.1-win-x64.exemacOS (Apple Silicon):Open.Cowork-3.3.1-mac-arm64.dmg安装:Windows: 双击.exe文件按提示完成安装macOS: 双击.dmg将应用拖入 Applications 文件夹macOS 安全提示处理:如果提示无法验证开发者:方案 A: 前往系统设置 隐私与安全性点击仍要打开方案 B: 使用 Homebrew 安装推荐自动跳过验证网络配置:如果使用代理软件需要开启虚拟网卡 (TUN 模式)以支持 WebSearch 等联网工具。5.3 方式三源码编译开发者前置条件:Node.js 22npm 10macOS 或 Windows步骤:# 1. 克隆仓库gitclone https://github.com/OpenCoworkAI/open-cowork.gitcdopen-cowork# 2. 安装依赖自动下载 Node 二进制 重编译原生模块npminstall# 3. 启动开发服务器npmrun dev# 4. 构建生产安装包npmrun build常用开发命令:命令用途npm run dev启动开发服务器 (Vite Electron)npm run dev:with-python带 Python 环境的开发模式npm run build完整生产构建npm run build:winWindows 专用构建npm run lintESLint 代码检查npm run formatPrettier 格式化npx tsc --noEmitTypeScript 类型检查npm run test运行 Vitest 测试npm run test:coverage带覆盖率报告的测试5.4 沙盒配置可选但推荐Windows (WSL2):# 如果尚未安装 WSL2wsl--install# 重启后Open Cowork 会自动检测并启用 WSL2 沙盒macOS (Lima):# 安装 Limabrewinstalllima# Open Cowork 会自动创建名为 claude-sandbox 的 Lima 虚拟机如果无法安装虚拟机Open Cowork 会回退到路径守卫模式仍能提供基本安全保护。六、使用方法详细6.1 首次配置步骤 1: 获取 API Key根据你的需求选择 AI 服务商:服务商获取 Key 地址Base URL推荐模型OpenRouterhttps://openrouter.ai/https://openrouter.ai/apiclaude-4-5-sonnetAnthropichttps://console.anthropic.com/(默认)claude-4-5-sonnet智谱 AIhttps://bigmodel.cn/glm-codinghttps://open.bigmodel.cn/api/anthropicglm-4.7,glm-4.6MiniMaxhttps://platform.minimaxi.com/subscribe/coding-planhttps://api.minimaxi.com/anthropicminimax-m2Kimihttps://www.kimi.com/membership/pricinghttps://api.kimi.com/coding/kimi-k2步骤 2: 在应用中配置打开 Open Cowork 应用点击左下角⚙️ 设置图标在设置面板中填写:API Key: 粘贴你的 API 密钥Base URL: 根据上表填写使用智谱/MiniMax 等非 Anthropic 原生接口时必须填写Model: 输入你想使用的模型名称保存设置步骤 3: 选择工作区在主界面选择一个文件夹作为工作区AI Agent 将在此文件夹内读取和写入文件所有操作被限制在此工作区范围内沙盒保护6.2 日常使用基本对话:在聊天输入框中输入自然语言指令AI 将在工作区内执行任务。示例指令:读取当前文件夹下的 financial_report.csv并帮我生成一份包含 5 页幻灯片的 PPT 总结报告。 整理这个文件夹把图片归类到 images 子文件夹文档归类到 docs 子文件夹。 帮我创建一个 Excel 表格包含月度销售数据字段有日期、产品、数量、金额。多模态输入:直接将文件拖拽到聊天输入框将图片拖拽到聊天输入框支持多种文件格式实时追踪:在 Trace Panel 中观察 AI 的推理过程查看工具调用详情MCP/Skills/文件系统操作了解每一步的执行状态6.3 使用 Skills 生成文档生成 PPTX (PowerPoint):请帮我根据 README.md 的内容生成一份产品介绍 PPT包含 8 页幻灯片。生成 DOCX (Word):将会议记录整理成一份正式的 Word 文档包含标题、章节和要点。生成 XLSX (Excel):从日志文件中提取数据生成 Excel 报表包含汇总和图表。生成/处理 PDF:将这份 HTML 文件转换为 PDF 格式。 提取这份 PDF 中的所有表格数据。创建自定义 Skill:使用内置的skill-creator工具在对话中描述你需要的技能AI 将引导你创建新的 Skill 定义文件保存在.claude/skills/目录下。6.4 使用 MCP 连接器配置 MCP 连接器:打开设置面板找到 MCP 连接器配置添加连接器:浏览器: 让 AI 控制浏览器进行搜索和导航Notion: 连接 Notion 工作区需要先设置 Notion Integration Token并在根页面添加连接自定义: 支持 stdio / SSE / Streamable HTTP 三种传输协议Notion 连接器特别步骤:在 Notion 创建 Integration获取 Internal Integration Token在 Open Cowork 设置中填入 Token在 Notion 根页面添加该 Integration 的连接参考: https://www.notion.com/help/add-and-manage-connections-with-the-api6.5 GUI 自动化操作适用场景: 控制桌面应用程序如微信、Chrome 浏览器等使用步骤:确保使用Gemini-3-Pro模型推荐在对话中描述 GUI 操作需求AI 通过截图识别界面自动执行点击和键盘操作示例:帮我打开微信给张三发送一条消息明天下午三点开会。 打开 Chrome访问 Google搜索 AI Agent 2026。注意: GUI 操作需要适当的无障碍权限macOS 需要在 系统设置 隐私与安全性 辅助功能 中授权。6.6 远程控制飞书 / Slack飞书集成:在 Open Cowork 设置中启用飞书远程控制配置飞书应用凭证App ID、App Secret首次使用时需要完成配对流程配对模式 UI 审批面板通过飞书发送指令AI 在本地执行并返回结果Slack 集成:在设置中配置 Slack Bot Token配对和授权通过 Slack 频道或私聊发送指令工作流程:用户 → 飞书/Slack → ngrok 隧道 → Open Cowork → 本地执行 → 结果 → 飞书/Slack → 用户6.7 会话管理新建会话: 在侧边栏创建新会话会话历史: 所有历史会话存储在本地 SQLite 数据库中会话切换: 侧边栏列出所有会话点击切换上下文记忆: 每个会话保持独立上下文支持跨会话检索v3.3.0 新增内存系统6.8 环境配置.env.example# API 配置# 必填: 设置你的 API 认证令牌# ANTHROPIC_AUTH_TOKEN***# 可选: 自定义 API 端点# ANTHROPIC_BASE_URLhttps://openrouter.ai/api# 可选: 模型选择# CLAUDE_MODELanthropic/claude-sonnet-4.5# 可选: 自定义 Claude Code CLI 路径# 重要: Windows 上使用正斜杠 (/) 而非反斜杠 (\)# CLAUDE_CODE_PATHC:/Users/yourname/AppData/Roaming/npm/node_modules/anthropic-ai/claude-code/cli.js七、版本历史版本日期关键更新v3.3.12026-05-23最新稳定版v3.3.02026-04-18飞书远程控制配对 UI、官网、Codex PR Review Bot、安全加固zip-slip/路径穿越、截图显示优化v3.3.0-beta.82026-03-29~100 个测试文件、810 安全漏洞修复、VM 沙盒命令注入防护v3.2.02026-03-02GUI 自动化Windows、拖拽文件/图片附件v3.1.02026-02-13V2 插件运行时、MCP 连接器管理、演示视频v3.0.02026-02-08重大重构: 移除代理层SDK-first 架构v2.0.02026-01-25架构大改: Electron React UI 沙盒 Skillsv1.0.02025-12-01初始版本八、开发路线图已完成稳定的 Windows 和 macOS 安装包 构建验证完整文件系统沙盒 路径穿越/zip-slip 加固VM 沙盒 (WSL2/Lima)Skills (PPTX/DOCX/PDF/XLSX) 自定义技能 热重载MCP 连接器 (stdio/SSE/Streamable HTTP)富文本输入文件/图片多模型支持 (Claude/GPT/Gemini/DeepSeek/Qwen/GLM/Kimi/Grok/MiniMax/Ollama)中英文界面飞书远程控制配对模式 审批面板自动化 CI/CD Codex PR Review Bot内存系统基础统一存储 源感知检索短期计划 (v3.4.0)沙盒加固VM 启动性能、跨平台一致性安装包瘦身: 从 ~156MB 减至 ~80MB代码拆分index.ts 2672行 → 拆分、gui-operate-server.ts 6884行 → 拆分命名规范化清理 75 遗留引用工具补全TodoWrite、AskUserQuestion、Glob、Grep、WebFetch、WebSearch内存系统增强提示注入控制、跨会话检索 UX定时任务: Cron-like 任务调度Linux 原生支持中期计划 (v3.5.0)插件系统: 社区驱动的可扩展架构多 Agent: 编排多个 Agent 执行复杂工作流工作区模板: 预配置环境编程、写作、研究等场景长期愿景Computer Use (CUA): 完整的 GUI 自动化协作模式: 多用户共享工作区移动伴侣: 移动端轻量监控和快速交互九、安全模型9.1 多层安全保护路径守卫 (Path Guard): 文件操作严格限制在工作区文件夹内VM 沙盒: WSL2 (Windows) / Lima (macOS) 虚拟机隔离执行权限审批: PermissionDialog 组件要求用户确认敏感操作安全加固: zip-slip 防护、路径穿越防护、命令注入防护9.2 安全审计v3.3.0-beta.8 修复了 8 个严重 10 个高危安全漏洞20 个中等严重程度的加固修复VM 沙盒防护命令注入 符号链接攻击安全策略文档: SECURITY.md依赖项安全更新Dependabot 自动管理9.3 隐私保护所有数据存储在本地SQLite不会向 Open Cowork 服务器发送任何数据唯一的外部通信是与用户配置的 AI 模型 API敏感信息API Key日志脱敏十、开发者指南10.1 代码规范TypeScript strict mode禁止隐式 anyESLint Prettier2 空格缩进React 函数组件 Hooks禁止类组件Tailwind CSS 样式禁止 CSS Modules图标使用 lucide-react单个组件文件不超过 500 行所有用户可见文本必须通过 i18next 国际化10.2 Git 工作流main — 稳定发布 dev — 集成分支PR 目标 feature/name — 新功能 fix/name — Bug 修复Conventional Commits强制:feat(mcp): add Streamable HTTP transport support fix(sandbox): handle WSL2 path with spaces docs: update README setup instructions test(session): add unit tests for session-manager10.3 PR 规范PR 目标为dev分支发布除外每个 feat/fix PR 必须附带测试CI 必须通过lint type-check test变更最小化、聚焦禁止使用any类型10.4 依赖管理级别范围合并策略自动合并GitHub Actions / dev-deps patchminorCI 通过即合并快速审核生产依赖 patch查看 changelog 后合并手动审核生产依赖 minor仔细阅读 changelog专用分支任何依赖 major创建迁移分支充分测试10.5 测试框架: Vitest测试文件与源码同目录或tests/目录约 100 个测试文件v3.3.0-beta.8覆盖率报告:npm run test:coverage十一、社区与生态11.1 社区渠道平台地址说明GitHubhttps://github.com/OpenCoworkAI/open-cowork代码仓库、Issues、DiscussionsDiscordhttps://discord.gg/pynjtQDf实时聊天、技术支持微信群二维码见 README中文社区11.2 贡献者主要贡献者包括:hqhq1025Sun-sunshine06JackXFanandoan16十二、优缺点分析12.1 优点完全免费开源MIT 协议仅需支付 AI API 费用多模型支持广泛包括国产大模型智谱、MiniMax、Kimi开箱即用预构建安装包无需编程知识多级沙盒保护WSL2/Lima 虚拟机隔离功能丰富: MCP 连接器、Skills 系统、GUI 自动化、远程控制活跃开发从 v1.0 到 v3.3 快速迭代国际化支持中英文安全性重视3 轮安全审计 持续加固完善的测试覆盖~100 个测试文件代码质量高TypeScript strict ESLint Prettier Conventional Commits12.2 缺点 / 待改进安装包较大~156MB计划在 v3.4.0 减至 ~80MB暂无官方 Linux 安装包仅支持源码编译部分文件过大gui-operate-server.ts 6884行、index.ts 2672行命名尚未完全规范化75 遗留引用待清理工具集待补全TodoWrite、WebFetch 等尚未原生实现GUI 自动化依赖 Gemini-3-Pro模型限制内存系统仍为基础版本prompt 注入控制待完善12.3 适用场景场景推荐度说明文档生成PPTX/DOCX/XLSX/PDF★★★★★Skills 系统原生支持文件整理与批量处理★★★★★沙盒内文件操作桌面 GUI 自动化★★★★☆需要 Gemini-3-Pro多模型对比测试★★★★★支持 10 模型提供商远程办公协作飞书/Slack★★★★☆远程控制已实现Linux 服务器环境★★☆☆☆仅源码编译无预构建包大规模企业部署★★★☆☆待插件系统和多 Agent十三、总结Open Cowork 是 Claude Cowork 的一个优秀开源替代品具有以下突出特点:功能比 Claude Cowork 更强: 多模型支持、GUI 自动化、远程控制、开源可审计安全性设计完善: 三级沙盒 路径守卫 安全审计扩展性好: MCP 协议 Skills 系统 即将推出的插件系统开发者友好: 完善的 TypeScript 工程化、测试覆盖、贡献指南社区活跃: 快速迭代5 个月内从 v1.0 到 v3.3多语言社区推荐使用人群:需要使用 AI 进行桌面自动化的非技术用户希望替代 Claude Cowork 的多模型用户需要飞书/Slack 远程控制的团队协作对安全性有要求的用户VM 沙盒隔离想要自定义和二次开发的开发者
OpenCoworkAI安装、使用方法详细全解
发布时间:2026/6/9 14:46:34
OpenCoworkAI安装、使用方法详细全解数据来源: GitHub API、项目官方文档、第三方评测仓库地址: https://github.com/OpenCoworkAI/open-cowork一、项目概览1.1 基本介绍Open Cowork 是一款免费开源的 AI Agent 桌面应用定位为 Claude Cowork 的开源替代实现。它将 Claude Code、OpenAI、Gemini、DeepSeek 等多种 AI 模型封装为图形界面提供一键安装无需编程或终端知识即可使用。核心理念: 让每个人都能轻松使用 AI 驱动的桌面自动化。1.2 关键指标指标数值开源协议MIT主要语言TypeScript仓库大小~77.6 MB创建时间2026-01-13社区Discord 微信群1.3 一句话总结Open Cowork 是基于 Electron Claude Agent SDK 构建的桌面 AI Agent 应用支持多模型、MCP 连接器、Skills 技能系统、VM 沙盒隔离、GUI 自动化和远程协作是 Claude Cowork 的开源增强版。二、竞品对比特性Claude CoworkOpenClawOpen CoworkMCP Skills✓✓✓远程控制✗✓✓GUI 操作✗✗✓多模型支持✗ (仅 Claude)部分✓ (广泛)VM 沙盒隔离✓部分✓ (WSL2/Lima)开源✗✓✓收费订阅制免费免费 (仅付 API 费)三、核心特性详解3.1 一键安装提供 Windows (.exe) 和 macOS (.dmg) 预构建安装包支持 Homebrew 一键安装无需配置 Node.js / Python 环境3.2 多模型支持支持以下 AI 服务商和模型:服务商Base URL推荐模型OpenRouterhttps://openrouter.ai/apiclaude-4-5-sonnetAnthropic(默认)claude-4-5-sonnet智谱 AI (GLM)https://open.bigmodel.cn/api/anthropicglm-4.7,glm-4.6MiniMaxhttps://api.minimaxi.com/anthropicminimax-m2Kimihttps://api.kimi.com/coding/kimi-k2OpenAI 兼容自定义任意兼容模型GeminiGoogle 官方gemini-3-pro(推荐用于 GUI 操作)DeepSeek官方 API多种模型Qwen通义千问 API多种模型Ollama本地部署任意本地模型GrokxAI API多种模型底层架构: v3.0 移除代理层所有请求通过 Claude Agent SDK 直连采用 SDK-first 架构。3.3 虚拟机级别沙盒隔离三级安全保护:级别平台技术说明基础全平台路径守卫文件操作限制在工作区文件夹内增强WindowsWSL2命令在隔离的 Linux 虚拟机中执行增强macOSLima命令在隔离的 Ubuntu 虚拟机中执行沙盒代码模块:sandbox-adapter.ts- 沙盒适配器抽象wsl-bridge.ts/wsl-agent/- WSL2 通信桥lima-bridge.ts/lima-agent/- Lima 通信桥path-guard.ts/path-resolver.ts- 路径安全守卫sandbox-bootstrap.ts/sandbox-sync.ts- 初始化和同步native-executor.ts- 回退模式下的本地执行器path-containment.ts- 路径包含检查3.4 Skills 技能系统内置 5 个 Skills位于.claude/skills/目录:Skill功能pptxPowerPoint 演示文稿生成docxWord 文档处理pdfPDF 处理与表单xlsxExcel 电子表格生成skill-creator自定义技能开发工具包特性:支持热重载hot-reload用户可添加自定义 Skill通过skill-creator工具创建新 SkillSkills 管理模块位于src/main/skills/skills-manager.ts3.5 MCP (Model Context Protocol) 连接器MCP 让 AI 能连接外部工具和服务。Open Cowork 支持三种传输方式:传输方式说明stdio标准输入/输出 (本地进程)SSEServer-Sent Events (事件流)Streamable HTTP可流式化的 HTTP 连接MCP 代码模块:mcp-manager.ts- MCP 服务器生命周期管理mcp-config-store.ts- MCP 配置持久化mcp-oauth.ts- OAuth 认证支持mcp-logger.ts- MCP 日志记录gui-operate-server.ts- GUI 操作服务器 (6884 行)支持的 MCP 连接器: 浏览器、Notion、自定义应用等3.6 GUI 自动化操作可控制和操作桌面 GUI 应用程序屏幕截图 鼠标/键盘控制推荐模型:Gemini-3-Pro最佳 GUI 理解能力v3.2.0 新增 Windows 桌面应用自动化含微信工作流演示底层的gui-operate-server.ts实现了完整的 GUI 操作引擎3.7 远程控制平台状态飞书 (Lark)已支持含配对模式和审批面板Slack已支持远程控制代码模块:remote-manager.ts- 远程连接管理remote-config-store.ts- 远程配置存储gateway.ts- 消息网关message-router.ts- 消息路由tunnel-manager.ts- 隧道管理基于 ngrokchannels/- 多通道支持3.8 其他核心特性多模态输入: 拖拽文件和图片到聊天框实时追踪: Trace Panel 观察 AI 推理和工具调用会话管理: SQLite 持久化会话历史内存管理: 统一存储、核心/经验记忆、源感知检索国际化: 中英文界面i18next实时日志: 日志轮转和查看器四、技术架构4.1 技术栈层次技术桌面框架Electron ^35.7.5前端框架React ^18.3.1 React DOM状态管理Zustand ^5.0.12构建工具Vite ^7.3.1CSSTailwind CSS ^3.4.16 PostCSS语言TypeScript ^5.3.3 (strict mode)数据库better-sqlite3 ^12.8.0国际化i18next ^25.10.1测试Vitest ^4.1.0代码格式ESLint ^8.56.0 Prettier ^3.8.3AI SDKanthropic-ai/sdk ^0.39.0, mariozechner/pi-coding-agent ^0.60.0MCP SDKmodelcontextprotocol/sdk ^1.26.0飞书 SDKlarksuiteoapi/node-sdk ^1.59.0Slack SDKslack/bolt 4.7.0, slack/web-api 7.15.1数学渲染KaTeX ^0.16.45Markdownreact-markdown remark-gfm rehype-katex远程隧道ngrok ^5.0.0-beta.2Node.js 版本要求: 224.2 项目目录结构open-cowork/ ├── src/ │ ├── main/ # Electron 主进程 (Node.js) │ │ ├── index.ts # 主入口 │ │ ├── claude/ # AI Agent 执行 │ │ │ ├── agent-runner.ts # Agent 执行逻辑 (124KB) │ │ │ ├── agent-runner-loop-guard.ts # 循环保护 │ │ │ ├── agent-runner-message-end.ts # 消息结束处理 │ │ │ ├── claude-sdk-one-shot.ts # SDK 一次性调用 │ │ │ ├── pi-model-resolution.ts # 多模型解析 │ │ │ ├── pi-session-runtime.ts # 会话运行时 │ │ │ ├── shared-auth.ts # 共享认证 │ │ │ ├── think-tag-parser.ts # 思考标签解析 │ │ │ ├── tool-result-utils.ts # 工具结果处理 │ │ │ └── windows-bash-operations.ts # Windows Bash 操作 │ │ ├── config/ # 配置管理 (electron-store) │ │ ├── db/ # SQLite 数据库 │ │ ├── ipc/ # IPC 处理器 │ │ ├── memory/ # 内存管理 │ │ ├── sandbox/ # 沙盒与路径解析 │ │ │ ├── wsl-agent/ # WSL2 Agent │ │ │ ├── lima-agent/ # Lima Agent │ │ │ ├── wsl-bridge.ts │ │ │ ├── lima-bridge.ts │ │ │ ├── path-guard.ts │ │ │ └── ... │ │ ├── session/ # 会话管理 │ │ ├── skills/ # Skills 加载与管理 │ │ ├── tools/ # 工具执行 │ │ │ ├── tool-executor.ts │ │ │ ├── sandbox-tool-executor.ts │ │ │ └── path-containment.ts │ │ ├── mcp/ # MCP 连接器 │ │ │ ├── mcp-manager.ts │ │ │ ├── mcp-oauth.ts │ │ │ ├── mcp-config-store.ts │ │ │ ├── mcp-logger.ts │ │ │ └── gui-operate-server.ts │ │ ├── remote/ # 远程控制 (飞书/Slack) │ │ │ ├── remote-manager.ts │ │ │ ├── gateway.ts │ │ │ ├── message-router.ts │ │ │ ├── tunnel-manager.ts │ │ │ └── channels/ │ │ └── schedule/ # 定时任务 │ ├── preload/ # Electron 预加载脚本 │ └── renderer/ # React 前端 UI │ ├── components/ # UI 组件 │ │ ├── ChatView.tsx # 主聊天界面 │ │ ├── ConfigModal.tsx # 设置对话框 │ │ ├── ContextPanel.tsx # 文件上下文 │ │ ├── MessageCard.tsx # 消息卡片 │ │ ├── PermissionDialog.tsx │ │ ├── Sidebar.tsx # 侧边栏 │ │ ├── Titlebar.tsx # 自定义标题栏 │ │ ├── TracePanel.tsx # 推理追踪面板 │ │ └── WelcomeView.tsx # 欢迎页 │ ├── hooks/ # React Hooks │ ├── store/ # Zustand 状态 │ ├── i18n/ # 国际化 │ ├── styles/ # Tailwind CSS │ ├── types/ # TypeScript 类型 │ └── utils/ # 工具函数 ├── .claude/ │ └── skills/ # 默认技能 │ ├── pptx/ │ ├── docx/ │ ├── pdf/ │ ├── xlsx/ │ └── skill-creator/ ├── docs/ # 文档 ├── resources/ # 静态资源 ├── scripts/ # 构建脚本 ├── patches/ # patch-package 补丁 ├── tests/ # 测试文件 ├── website/ # 官网 (VitePress) ├── electron-builder.yml # Electron 构建配置 ├── vite.config.ts # Vite 配置 ├── tailwind.config.js # Tailwind 配置 └── package.json4.3 核心工作流程用户输入 → ChatView → IPC → Agent Runner ↓ Claude SDK / PI SDK ↓ ┌───────────┼───────────┐ ↓ ↓ ↓ MCP 工具 Skills 文件系统 ↓ 浏览器/Notion 文档生成 沙盒读写 ↓ 结果 → Trace Panel → 用户界面五、安装与配置详细步骤5.1 方式一Homebrew 安装macOS 推荐# 添加 Open Cowork 的 Homebrew tapbrew tap OpenCoworkAI/tap# 安装 Open Cowork跳过 Gatekeeper 验证brewinstall--cask--no-quarantine open-cowork--no-quarantine标志绕过 macOS Gatekeeper不会出现Apple 无法验证此应用警告。后续更新:brew upgrade--caskopen-cowork5.2 方式二下载安装包步骤:访问 Release 页面: https://github.com/OpenCoworkAI/open-cowork/releases下载对应平台的安装包:Windows:Open.Cowork-3.3.1-win-x64.exemacOS (Apple Silicon):Open.Cowork-3.3.1-mac-arm64.dmg安装:Windows: 双击.exe文件按提示完成安装macOS: 双击.dmg将应用拖入 Applications 文件夹macOS 安全提示处理:如果提示无法验证开发者:方案 A: 前往系统设置 隐私与安全性点击仍要打开方案 B: 使用 Homebrew 安装推荐自动跳过验证网络配置:如果使用代理软件需要开启虚拟网卡 (TUN 模式)以支持 WebSearch 等联网工具。5.3 方式三源码编译开发者前置条件:Node.js 22npm 10macOS 或 Windows步骤:# 1. 克隆仓库gitclone https://github.com/OpenCoworkAI/open-cowork.gitcdopen-cowork# 2. 安装依赖自动下载 Node 二进制 重编译原生模块npminstall# 3. 启动开发服务器npmrun dev# 4. 构建生产安装包npmrun build常用开发命令:命令用途npm run dev启动开发服务器 (Vite Electron)npm run dev:with-python带 Python 环境的开发模式npm run build完整生产构建npm run build:winWindows 专用构建npm run lintESLint 代码检查npm run formatPrettier 格式化npx tsc --noEmitTypeScript 类型检查npm run test运行 Vitest 测试npm run test:coverage带覆盖率报告的测试5.4 沙盒配置可选但推荐Windows (WSL2):# 如果尚未安装 WSL2wsl--install# 重启后Open Cowork 会自动检测并启用 WSL2 沙盒macOS (Lima):# 安装 Limabrewinstalllima# Open Cowork 会自动创建名为 claude-sandbox 的 Lima 虚拟机如果无法安装虚拟机Open Cowork 会回退到路径守卫模式仍能提供基本安全保护。六、使用方法详细6.1 首次配置步骤 1: 获取 API Key根据你的需求选择 AI 服务商:服务商获取 Key 地址Base URL推荐模型OpenRouterhttps://openrouter.ai/https://openrouter.ai/apiclaude-4-5-sonnetAnthropichttps://console.anthropic.com/(默认)claude-4-5-sonnet智谱 AIhttps://bigmodel.cn/glm-codinghttps://open.bigmodel.cn/api/anthropicglm-4.7,glm-4.6MiniMaxhttps://platform.minimaxi.com/subscribe/coding-planhttps://api.minimaxi.com/anthropicminimax-m2Kimihttps://www.kimi.com/membership/pricinghttps://api.kimi.com/coding/kimi-k2步骤 2: 在应用中配置打开 Open Cowork 应用点击左下角⚙️ 设置图标在设置面板中填写:API Key: 粘贴你的 API 密钥Base URL: 根据上表填写使用智谱/MiniMax 等非 Anthropic 原生接口时必须填写Model: 输入你想使用的模型名称保存设置步骤 3: 选择工作区在主界面选择一个文件夹作为工作区AI Agent 将在此文件夹内读取和写入文件所有操作被限制在此工作区范围内沙盒保护6.2 日常使用基本对话:在聊天输入框中输入自然语言指令AI 将在工作区内执行任务。示例指令:读取当前文件夹下的 financial_report.csv并帮我生成一份包含 5 页幻灯片的 PPT 总结报告。 整理这个文件夹把图片归类到 images 子文件夹文档归类到 docs 子文件夹。 帮我创建一个 Excel 表格包含月度销售数据字段有日期、产品、数量、金额。多模态输入:直接将文件拖拽到聊天输入框将图片拖拽到聊天输入框支持多种文件格式实时追踪:在 Trace Panel 中观察 AI 的推理过程查看工具调用详情MCP/Skills/文件系统操作了解每一步的执行状态6.3 使用 Skills 生成文档生成 PPTX (PowerPoint):请帮我根据 README.md 的内容生成一份产品介绍 PPT包含 8 页幻灯片。生成 DOCX (Word):将会议记录整理成一份正式的 Word 文档包含标题、章节和要点。生成 XLSX (Excel):从日志文件中提取数据生成 Excel 报表包含汇总和图表。生成/处理 PDF:将这份 HTML 文件转换为 PDF 格式。 提取这份 PDF 中的所有表格数据。创建自定义 Skill:使用内置的skill-creator工具在对话中描述你需要的技能AI 将引导你创建新的 Skill 定义文件保存在.claude/skills/目录下。6.4 使用 MCP 连接器配置 MCP 连接器:打开设置面板找到 MCP 连接器配置添加连接器:浏览器: 让 AI 控制浏览器进行搜索和导航Notion: 连接 Notion 工作区需要先设置 Notion Integration Token并在根页面添加连接自定义: 支持 stdio / SSE / Streamable HTTP 三种传输协议Notion 连接器特别步骤:在 Notion 创建 Integration获取 Internal Integration Token在 Open Cowork 设置中填入 Token在 Notion 根页面添加该 Integration 的连接参考: https://www.notion.com/help/add-and-manage-connections-with-the-api6.5 GUI 自动化操作适用场景: 控制桌面应用程序如微信、Chrome 浏览器等使用步骤:确保使用Gemini-3-Pro模型推荐在对话中描述 GUI 操作需求AI 通过截图识别界面自动执行点击和键盘操作示例:帮我打开微信给张三发送一条消息明天下午三点开会。 打开 Chrome访问 Google搜索 AI Agent 2026。注意: GUI 操作需要适当的无障碍权限macOS 需要在 系统设置 隐私与安全性 辅助功能 中授权。6.6 远程控制飞书 / Slack飞书集成:在 Open Cowork 设置中启用飞书远程控制配置飞书应用凭证App ID、App Secret首次使用时需要完成配对流程配对模式 UI 审批面板通过飞书发送指令AI 在本地执行并返回结果Slack 集成:在设置中配置 Slack Bot Token配对和授权通过 Slack 频道或私聊发送指令工作流程:用户 → 飞书/Slack → ngrok 隧道 → Open Cowork → 本地执行 → 结果 → 飞书/Slack → 用户6.7 会话管理新建会话: 在侧边栏创建新会话会话历史: 所有历史会话存储在本地 SQLite 数据库中会话切换: 侧边栏列出所有会话点击切换上下文记忆: 每个会话保持独立上下文支持跨会话检索v3.3.0 新增内存系统6.8 环境配置.env.example# API 配置# 必填: 设置你的 API 认证令牌# ANTHROPIC_AUTH_TOKEN***# 可选: 自定义 API 端点# ANTHROPIC_BASE_URLhttps://openrouter.ai/api# 可选: 模型选择# CLAUDE_MODELanthropic/claude-sonnet-4.5# 可选: 自定义 Claude Code CLI 路径# 重要: Windows 上使用正斜杠 (/) 而非反斜杠 (\)# CLAUDE_CODE_PATHC:/Users/yourname/AppData/Roaming/npm/node_modules/anthropic-ai/claude-code/cli.js七、版本历史版本日期关键更新v3.3.12026-05-23最新稳定版v3.3.02026-04-18飞书远程控制配对 UI、官网、Codex PR Review Bot、安全加固zip-slip/路径穿越、截图显示优化v3.3.0-beta.82026-03-29~100 个测试文件、810 安全漏洞修复、VM 沙盒命令注入防护v3.2.02026-03-02GUI 自动化Windows、拖拽文件/图片附件v3.1.02026-02-13V2 插件运行时、MCP 连接器管理、演示视频v3.0.02026-02-08重大重构: 移除代理层SDK-first 架构v2.0.02026-01-25架构大改: Electron React UI 沙盒 Skillsv1.0.02025-12-01初始版本八、开发路线图已完成稳定的 Windows 和 macOS 安装包 构建验证完整文件系统沙盒 路径穿越/zip-slip 加固VM 沙盒 (WSL2/Lima)Skills (PPTX/DOCX/PDF/XLSX) 自定义技能 热重载MCP 连接器 (stdio/SSE/Streamable HTTP)富文本输入文件/图片多模型支持 (Claude/GPT/Gemini/DeepSeek/Qwen/GLM/Kimi/Grok/MiniMax/Ollama)中英文界面飞书远程控制配对模式 审批面板自动化 CI/CD Codex PR Review Bot内存系统基础统一存储 源感知检索短期计划 (v3.4.0)沙盒加固VM 启动性能、跨平台一致性安装包瘦身: 从 ~156MB 减至 ~80MB代码拆分index.ts 2672行 → 拆分、gui-operate-server.ts 6884行 → 拆分命名规范化清理 75 遗留引用工具补全TodoWrite、AskUserQuestion、Glob、Grep、WebFetch、WebSearch内存系统增强提示注入控制、跨会话检索 UX定时任务: Cron-like 任务调度Linux 原生支持中期计划 (v3.5.0)插件系统: 社区驱动的可扩展架构多 Agent: 编排多个 Agent 执行复杂工作流工作区模板: 预配置环境编程、写作、研究等场景长期愿景Computer Use (CUA): 完整的 GUI 自动化协作模式: 多用户共享工作区移动伴侣: 移动端轻量监控和快速交互九、安全模型9.1 多层安全保护路径守卫 (Path Guard): 文件操作严格限制在工作区文件夹内VM 沙盒: WSL2 (Windows) / Lima (macOS) 虚拟机隔离执行权限审批: PermissionDialog 组件要求用户确认敏感操作安全加固: zip-slip 防护、路径穿越防护、命令注入防护9.2 安全审计v3.3.0-beta.8 修复了 8 个严重 10 个高危安全漏洞20 个中等严重程度的加固修复VM 沙盒防护命令注入 符号链接攻击安全策略文档: SECURITY.md依赖项安全更新Dependabot 自动管理9.3 隐私保护所有数据存储在本地SQLite不会向 Open Cowork 服务器发送任何数据唯一的外部通信是与用户配置的 AI 模型 API敏感信息API Key日志脱敏十、开发者指南10.1 代码规范TypeScript strict mode禁止隐式 anyESLint Prettier2 空格缩进React 函数组件 Hooks禁止类组件Tailwind CSS 样式禁止 CSS Modules图标使用 lucide-react单个组件文件不超过 500 行所有用户可见文本必须通过 i18next 国际化10.2 Git 工作流main — 稳定发布 dev — 集成分支PR 目标 feature/name — 新功能 fix/name — Bug 修复Conventional Commits强制:feat(mcp): add Streamable HTTP transport support fix(sandbox): handle WSL2 path with spaces docs: update README setup instructions test(session): add unit tests for session-manager10.3 PR 规范PR 目标为dev分支发布除外每个 feat/fix PR 必须附带测试CI 必须通过lint type-check test变更最小化、聚焦禁止使用any类型10.4 依赖管理级别范围合并策略自动合并GitHub Actions / dev-deps patchminorCI 通过即合并快速审核生产依赖 patch查看 changelog 后合并手动审核生产依赖 minor仔细阅读 changelog专用分支任何依赖 major创建迁移分支充分测试10.5 测试框架: Vitest测试文件与源码同目录或tests/目录约 100 个测试文件v3.3.0-beta.8覆盖率报告:npm run test:coverage十一、社区与生态11.1 社区渠道平台地址说明GitHubhttps://github.com/OpenCoworkAI/open-cowork代码仓库、Issues、DiscussionsDiscordhttps://discord.gg/pynjtQDf实时聊天、技术支持微信群二维码见 README中文社区11.2 贡献者主要贡献者包括:hqhq1025Sun-sunshine06JackXFanandoan16十二、优缺点分析12.1 优点完全免费开源MIT 协议仅需支付 AI API 费用多模型支持广泛包括国产大模型智谱、MiniMax、Kimi开箱即用预构建安装包无需编程知识多级沙盒保护WSL2/Lima 虚拟机隔离功能丰富: MCP 连接器、Skills 系统、GUI 自动化、远程控制活跃开发从 v1.0 到 v3.3 快速迭代国际化支持中英文安全性重视3 轮安全审计 持续加固完善的测试覆盖~100 个测试文件代码质量高TypeScript strict ESLint Prettier Conventional Commits12.2 缺点 / 待改进安装包较大~156MB计划在 v3.4.0 减至 ~80MB暂无官方 Linux 安装包仅支持源码编译部分文件过大gui-operate-server.ts 6884行、index.ts 2672行命名尚未完全规范化75 遗留引用待清理工具集待补全TodoWrite、WebFetch 等尚未原生实现GUI 自动化依赖 Gemini-3-Pro模型限制内存系统仍为基础版本prompt 注入控制待完善12.3 适用场景场景推荐度说明文档生成PPTX/DOCX/XLSX/PDF★★★★★Skills 系统原生支持文件整理与批量处理★★★★★沙盒内文件操作桌面 GUI 自动化★★★★☆需要 Gemini-3-Pro多模型对比测试★★★★★支持 10 模型提供商远程办公协作飞书/Slack★★★★☆远程控制已实现Linux 服务器环境★★☆☆☆仅源码编译无预构建包大规模企业部署★★★☆☆待插件系统和多 Agent十三、总结Open Cowork 是 Claude Cowork 的一个优秀开源替代品具有以下突出特点:功能比 Claude Cowork 更强: 多模型支持、GUI 自动化、远程控制、开源可审计安全性设计完善: 三级沙盒 路径守卫 安全审计扩展性好: MCP 协议 Skills 系统 即将推出的插件系统开发者友好: 完善的 TypeScript 工程化、测试覆盖、贡献指南社区活跃: 快速迭代5 个月内从 v1.0 到 v3.3多语言社区推荐使用人群:需要使用 AI 进行桌面自动化的非技术用户希望替代 Claude Cowork 的多模型用户需要飞书/Slack 远程控制的团队协作对安全性有要求的用户VM 沙盒隔离想要自定义和二次开发的开发者