Codex + 天工 SkyClaw:手把手教你搭建国产顶级 Agent! 大家好我是二哥呀。用 Agent 开发的小伙伴应该有个共同的感受模型选择是个大问题。Codex 默认跑的是 GPT-5.5能力没问题费用相对也合理。但国内很多小伙伴还是用不上所以我就在想。想找一个模型同时满足这三个条件Agent 任务执行能力强、上下文窗口够大、价格实惠。这里给大家提供一个不错的选项昆仑万维新发布的 SkyClaw v1.0。把它接进 Codex 之后我先后完成了两个真实项目的开发——PaiSwitch 的模型切换功能和 PaiAgent 的工作流适配。工具调用稳定、代码质量经得住考验。关键是输入价格比 DeepSeek V4 Pro 还便宜。01、为什么选择CodexSkyClaw先说清楚这个组合的逻辑免得大家觉得我在强行凑 CP。Codex 是 OpenAI 推出的 Agent 编程工具它的执行架构做得非常扎实。恐怕是目前公认的做得最好的 Agent 框架之一。我们也可以通过一些手段给他配备国产模型比如说DeepSeek V4 Pro或者今天的主角 SkyClaw v1.0。SkyClaw v1.0 是昆仑万维专门为 Agent 工作流训练的模型支持百万 token 上下文。训练环境基于 OpenClaw-style agent framework 构建覆盖了文件读取、代码编辑、内容检索、测试执行、页面观察这些高频 Agent 操作。加上高质量的合成数据微调和 Agentic 强化学习SkyClaw 在“长链任务执行”这件事上确实有一套。用我自己的话说就是交给它一个活它能从头干到尾中间不掉链子。跑分数据也能验证这一点评测项目SkyClaw v1.0说明PinchBench-V287.2综合 Agent 能力评测Claw-Eval Pass^359.7稳定性测试连续 3 次通过Claw-Eval Avg74.2平均通过率Skywork-Claw-Bench62.9Skywork 自研 Agent 评测在多项 Agent 专项评测中SkyClaw v1.0 超过了 Minimax 2.7、DeepSeek V4 Flash以及 Qwen 3.6 系列的 35B A3B 和 27B 模型。所以这个组合的逻辑是这样的。Codex 提供顶级的 Agent 执行框架和沙箱环境SkyClaw 提供专门为 Agent 任务训练的推理大脑。两个东西各自做最擅长的事拼到一起就是一个国产顶级 Agent。02、把SkyClaw接进CC说干就干。第一步在 PaiSwitch 里增加 SkyClaw 的 API 配置。需要填三个参数Base URL 填https://api.apifree.ai/agent模型名称填skyclaw-v1如果想用轻量版本就填skyclaw-v1-liteAPI Key 就是在 ApiFree 平台申请的那个ApiFree 的注册流程很简单注册一个账号就能拿到 API Key。上线期间免费调用不需要申请白名单不需要排队等审批。https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tabapi想薅免费 token 的小伙伴赶紧这种好事不知道能持续多久。配置完成后启动 Claude Code。如果模型选项里能看到skyclaw-v1说明配置成功了。用/status命令可以确认当前的模型状态。到这一步CC 的底层模型已经从 Opus 4.8 切换到 SkyClaw v1.0 了。接下来就是真刀真枪地干活看看 SkyClaw 到底能不能打。03、Codex的兼容适配Codex 本身只支持 OpenAI 的模型要接入 SkyClaw 需要一个中间适配层。我做了一个叫 PaiSwitch 的工具来解决这个问题——它在后台做了一层协议转换把 ApiFree 提供的 SkyClaw 接口转成 OpenAI 兼容格式让 Codex 能够无缝调用。第一个任务给 PaiSwitch 增加 Codex 底层 LLM 切换功能。这个需求意味着 SkyClaw 要做这么几件事先把项目现有的代码读一遍搞清楚 PaiSwitch 的架构和模块划分然后参考 Claude Code 已有的 settings.json 模型切换机制设计一个类似的方案再把方案实现出来写完代码还得跑通测试。在 CC 里输入参考 Claude Code 的 settings.json 模型切换机制给 PaiSwitch 增加 Codex 的底层 LLM 切换功能支持通过配置文件切换 SkyClaw v1.0、DeepSeek V4 Pro 等模型。SkyClaw 接到任务后没有急着动手写代码。它做的第一件事是读项目代码从入口文件开始逐步深入到各个模块搞清楚现有的代码结构和各组件之间的调用关系。读完代码后SkyClaw 自己梳理了一个任务清单拆成了四个子任务配置文件解析模块、模型路由层、API 适配器、命令行参数支持。每个子任务之间有清晰的依赖关系按顺序做下来就能完成整个功能。然后就开始逐个模块地写代码了。写代码的过程我全程观察了一下有一个细节让我印象比较深。就是它对上下文的保持。从开始到结束SkyClaw 一直记得自己在做什么、做到了哪一步、下一步该干什么。这在长链任务中非常关键。最终交付了一个完整的模型切换功能。PaiSwitch 现在支持在 GPT-5.5、DeepSeek V4 Pro 和 SkyClaw v1.0 之间自由切换通过配置文件或命令行参数都可以指定。总的来说这个任务的完成质量超出了我的预期。04、SkyClaw 改造 PaiAgentPaiSwitch 的功能开发完成后我又给 SkyClaw 安排了第二个任务把 SkyClaw 自己适配进 PaiAgent 的工作流系统。PaiAgent 是我做的一个开源工作流编排项目在 GitHub 上已经有 400 多个 star 了。它的核心功能是让用户通过可视化界面编排 AI 工作流把多个 LLM 节点、工具节点串联起来完成复杂任务。https://github.com/itwanger/PaiAgent问题出在 PaiAgent 的 LLM 节点上。它原本适配了 OpenAI、DeepSeek、GLM 这些常见的模型提供商每个提供商有各自的 API 格式、认证方式和参数规范。SkyClaw 通过 ApiFree 提供服务API 格式跟现有的提供商不一样直接配进去会报错。来让 SkyClaw 自己解决这个问题。先把 Codex 的底层模型切换到 SkyClaw。重启 Codex确认模型切换成功。然后把报错信息作为提示词输入我给 PaiAgent 配置了 skyclaw 模型但不适配 [18:49:34] ❌ 节点 [llm] 执行失败: 不支持的提供商类型: skyclaw-v1.0。这是 apifree 的官方 API。SkyClaw 先去找 PaiAgent 的 LLM 提供商注册代码把现有的适配层架构搞明白。每个提供商都实现了同一个接口通过工厂模式按名称创建对应的适配器。然后 SkyClaw 照着这个模式新写了一个 SkyClaw 适配器处理了 API 格式转换、请求头认证、响应解析这些细节。改完之后重新跑工作流通了。PaiAgent 的 AI 播客工作流能够正常调用 SkyClaw 来生成播客脚本了音频质量跟用 DeepSeek 跑出来的没有明显差别。等于是 SkyClaw 自己给自己铺了路自己的命运自己掌握了哈哈。05、SkyClaw的定价Agent 模型好不好用是一回事用不用得起是另一回事。跑 Agent 任务跟普通的对话问答不一样。普通问答是一问一答两次 API 调用就结束了。Agent 任务是一个长链条——模型要反复地读代码、分析问题、制定方案、写代码、跑测试、看结果、修代码一个中等复杂度的任务跑下来可能要调用模型几十次。每次调用都要消耗输入和输出 token。所以 Agent 场景下模型的单价是乘以调用次数的token 成本不菲。SkyClaw 的定价我仔细看了两遍。输入价格只有 DeepSeek V4 Pro 的二十四分之一大约是 MiniMax M2.7 的四分之一。况且还有 SkyClaw-v1.0-lite 版本。同样的架构和训练方法更小的参数量推理速度更快成本更低。对延迟敏感或者预算紧张的场景Lite 版本是一个很实用的选择。上线期间通过 ApiFree 可以免费调用。想试的小伙伴赶紧去注册这种免费额度不知道还能持续多久。对于个人开发者来说Agent 开发最大的门槛从来不是技术。框架有 Codex 和 Claude Code工具链也很成熟。真正卡脖子的是模型成本。好的模型调用贵便宜的模型干不了 Agent 的活。SkyClaw 在这两个维度上同时做到了不错的水平确实给个人开发者提供了一个很实际的选择。06、天工超级智能体聊了这么多 SkyClaw 在第三方 Agent 框架里的表现也得说说它的“原生主场”——天工超级智能体。天工是昆仑万维打造的一个多智能体协同平台。在对话框里给它一个任务目标它会自动拆解任务、调度多个专家级智能体、端到端交付成品。什么意思呢举个我自己的真实案例。最近在写 AI 编程工具的横评文章需要一份 Claude Code、Codex、Qoder 的竞品分析。以往的做法是自己翻官网、查文档、整理数据、做对比表格、排 PPT前前后后要忙大半天。这次我甩给天工一句话就完事了。天工调用了联网搜索、数据分析等多个 MCP 工具大概跑了十五分钟。最终输出了两样东西。第一份是深度分析报告一共九个章节内嵌了七个用 Chart.js 做的交互式数据图表覆盖产品概览、核心指标对比、功能差异、定价策略、生态适配、优劣势和选型建议。每个数据都标注了来源。第二份是团队分享 PPT十三页从封面到综合评分结构清晰排版干净。这个 PPT 不是那种“能看但还得自己大改一遍”的半成品。字号统一、间距合理、配色也不辣眼睛页面之间的逻辑衔接顺畅。直接拿去团队内部分享完全没问题不丢面子。天工内置了全模态编辑器文档、PPT、表格、图片都能在线编辑和导出。不过我觉得大多数时候不太需要改直接用就行了。云端虚拟机和定时任务天工在云端给每个用户开了一台虚拟机所有任务执行和文件读写都在云端完成。甚至可以关掉浏览器去做别的事情回来它还在跑文件也不会丢。支持多线程并行多条复杂工作流可以同时跑写文档、做 PPT、跑数据分析不用排队等候。天工还接入了飞书 IM支持定时自动化。不需要打开浏览器直接在飞书里下达任务。我配了一个实用的定时任务——每天早上八点天工自动搜索过去二十四小时的 AI 行业动态筛选五到八条有价值的热点去掉营销稿和重复信息推送到我的飞书。每天早上打开飞书一份筛选好的 AI 行业日报已经安静地躺在那儿了。旗舰模型和技能广场天工内置了多个顶级模型可以随意切换。除了自家的 SkyClaw 系列还有 DeepSeek V4 Pro、GLM-5.1 等。不确定选哪个就用智能调度模式让系统根据任务复杂度自动匹配。技能广场是天工另一个实用的地方。文档、PPT、图片生成、表格处理、网页搭建、视频制作接入了 Seedance 2.0 和 Kling 3.0各种专家级 Skill 都有。我测了一个场景让天工做一份“新员工 AI 工具使用培训”PPT。它先梳理了培训大纲逐页生成内容和排版最后输出 .pptx 文件。做 PPT 的同时还能参考之前上传的文档、联网搜索数据、读取 Excel 提取指标。这种跨模态的协同在很多单点 AI 工具上是做不到的。天工还支持自定义 Skill描述自己的工作场景和需求天工帮忙创建专属技能。用的次数越多天工对使用者的工作习惯和偏好就越了解生成的结果也越贴合实际需要。去年我就体验过天工的海外版 Skywork跟全球顶尖的 AI 产品正面交锋了一整年之后国内版做了一次大的跨代升级。给我的体感是它不是慢慢迭代出来的产品是带着实战经验回来的。endingCodex 加上 SkyClaw v1.0确实跑出了一个让我比较满意的组合。PaiSwitch 的模型切换功能从读代码到拆任务到写代码到跑测试到修 bug。PaiAgent 的工作流适配看了报错、找到代码、写了适配器、跑通工作流。SkyClaw 的 API 目前通过 ApiFree 平台免费开放。如果大家也在折腾 Agent 开发或者只是想找一个性价比高的模型跑 Codex都值得去试试。【一台电脑一个好用的 Agent 模型能干的事情比你想象的多。】我们下期见。加上 SkyClaw v1.0确实跑出了一个让我比较满意的组合。PaiSwitch 的模型切换功能从读代码到拆任务到写代码到跑测试到修 bug。PaiAgent 的工作流适配看了报错、找到代码、写了适配器、跑通工作流。[外链图片转存中…(img-8CbHXy4P-1780450190123)]SkyClaw 的 API 目前通过 ApiFree 平台免费开放。如果大家也在折腾 Agent 开发或者只是想找一个性价比高的模型跑 Codex都值得去试试。【一台电脑一个好用的 Agent 模型能干的事情比你想象的多。】我们下期见。