Claude/Codex CLI 搞定！世界级 Agent 工程师只用这几招，效率翻倍！

发布时间：2026/6/4 12:01:19

你是个开发者。你每天用着 Claude 或 Codex CLI心里老琢磨一件事我有没有把它的能力榨干偶尔你会看到它干出一些蠢得离谱的事然后不明白——为什么别人用 AI 像在造火箭而你连两块石头都叠不稳你以为是工具的问题。你装了一堆插件用了各种 harness终端换了又换CLAUDE.md 写了 26000 行。但结果还是那样——你还在地上趴着看别人在云端飞。这篇文章就是为你写的。提前说明当我提到 CLAUDE.md 的时候AGENT.md 也是同样的当我提到 Claude 的时候Codex 也是同理。这两个我都在大量使用。没人真正懂得怎么把 Agent 用到极致这是我这几个月最大的观察。极少数人能让 Agent 像世界的创造者一样运转其余大多数人则在各种工具里迷失以为找到了正确组合就能解锁 AGI。今天我只想说一句大实话你不需要最新的 agentic harness不需要装一堆依赖包也不需要每天刷文档保持领先。事实上你的热情可能正在帮倒忙。我不是说说而已。我从 Agent 刚能写代码时就开始用了。各种包、各种框架、各种范式都试过。我用 Agent 搭建过真正跑在生产环境里的信号系统、基础设施和数据管道不是玩具项目。走了一圈下来我现在用的是最接近裸奔的配置——只有基础 CLI加上几个核心原则——反而做出了我最好的工作。世界在狂奔但你不用追先说个背景。AI 公司正在经历一轮历史级别的爆发而且没有要停下来的迹象。每一代 Agent 都更听话、更能遵循复杂指令。几代之前你在 CLAUDE.md 里写做任何事之前先读这个文件它有一半概率直接无视你。现在它不仅会照做还能跟着嵌套逻辑走先读 A再读 B如果 C 成立再读 D。所以最重要的一条原则是每一代新 Agent 都会让你重新思考什么是最优解。这就是为什么越简单越好。装了太多库和框架你是在为一个可能根本不存在的问题锁死一套方案。而且你知道谁是 Agent 最狂热、用得最多的人吗是这些 AI 公司自己的员工——他们有无限的 token 预算用的是真正最新的模型。这意味着什么如果某个问题是真实存在的而且有好的解决方案这些公司早就把它内置进产品里了。Skills、记忆系统、子 Agent——这些一开始都是外部方案后来被验证有价值才被集成进了核心产品。所以如果某个东西真的有用Claude 和 Codex 最终会内置它。你不需要抢着用最新工具也不需要随时保持更新。偶尔更新一下你的 CLI看看新功能的 changelog就够了。上下文就是一切这是核心。用一堆插件和外部依赖的最大问题是上下文污染——你给 Agent 塞了太多它不需要的信息。举个例子你让它写个 Python 版 Hangman 游戏。但它的上下文里还有 26 个会话前的内存管理备注71 个会话前子进程爆炸留下的记录以及一条记得写笔记的通用规则……这些和 Hangman 有什么关系你只需要给 Agent 完成任务所需的精确信息不多也不少。各种奇怪的记忆系统、命名混乱的 Skills、没必要的插件——这些让你在让 Agent 写一首关于红杉林的小诗时塞给它一份炸弹说明书和一份蛋糕配方。真正有用的做法一、说清楚你要的实现方式把研究和实现分开。你说去帮我搭一个 auth 系统它得先研究什么是 auth 系统有哪些方案各有什么优劣上下文塞满了各种可能性——等到真正实现时早就乱了。换成用 bcrypt-12 密码哈希实现 JWT 认证refresh token 轮换7 天过期……它不需要调研任何其他方案直接干活。当然你不总是知道细节。这时可以这样先开一个研究任务搞清楚实现选项做好决策然后用一个全新上下文的 Agent 来实现。这样一想你会发现工作流里很多地方都在无谓地污染 Agent 的上下文。二、利用好讨好型设计没人想用一个整天否定自己的产品所以 Agent 被设计成尽量顺从你、执行你的指令。这很好用但也有陷阱。你说帮我找代码里的 bug它就会找到一个——哪怕得自己造一个出来。因为它想完成你的任务。所以用中性提示不要预设结果。不说找 bug改成“梳理一下这段代码的每个模块把你看到的情况都报给我。”这样有时能找到真的问题有时只是如实汇报代码运行逻辑但不会逼着它捏造一个 bug。你还可以反过来利用这个特性。我会让一个找 bug的 Agent 打分低影响 bug 1 分中等 5 分严重 10 分——它会非常积极地报出一大堆bug含真含假。这是所有可能 bug 的超集。然后让一个反驳Agent 去证伪这些 bug证伪成功得到对应分数证伪失败则扣双倍——它会积极反驳但有所顾忌。这是真实 bug 的子集。最后让一个裁判 Agent 对两边的结论评分——我告诉它我手上有正确答案对了 1错了 -1。裁判的结论我再过一遍准确率高得吓人。这套方法本质上是利用了 Agent 想讨好你这一特性让不同角色在不同激励下发挥各自所长。三、如何判断什么工具值得用很简单如果 OpenAI 和 Anthropic 都实现了它或者收购了做这件事的公司——那就是真的有用。Skills 现在是Claude和Codex两家的官方功能规划planning before coding从社区发现变成了核心能力记忆、语音、远程工作……这些都是被验证有价值后才被内置的。那些当时超级有用、后来随着新版本直接消失的 hack就不用再费心了。更新 CLI读 changelog就这样。四、压缩、上下文与假设你有没有遇到这种情况Agent 时而聪明得像神时而蠢得叫你抓狂关键在于它有没有被迫脑补。当 Agent 需要自己填空、连接信息结果往往立刻变差。解决方法在 CLAUDE.md 里写一条重新获取上下文的规则。每次压缩后compaction让 Agent 先重读任务计划和相关文件再继续工作。五、告诉 Agent 任务什么时候算完成这比你想的重要得多。人类对完成有很强的直觉Agent 没有。它知道怎么开始不知道什么时候该停——经常实现到一半就停了用 stub 凑数。用测试来定义完成。在 X 个测试全部通过之前任务没有结束不允许修改测试本身。测试是确定性的你可以清晰设定预期。另一个好用的方法截图验证。让 Agent 实现跑测试然后截图验证设计或行为——它会一直迭代直到满足你的要求。更进一步为每个任务创建一份{TASK}_CONTRACT.md里面列出所有需要完成的测试、截图和验证项。Agent 在完成合同里的所有要求之前不允许终止会话。六、关于跑 24 小时的 Agent很多人问怎么让 Agent 长时间运行又不跑偏方法很简单用 stophook 阻止 Agent 在合同完成前终止。但我要说一句——我没有发现超长运行的单一会话有多大优势。它天然会把不相关合同的上下文混在一起造成污染。我更推荐这样一个合同一个新会话。用一个编排层来管理有新任务就创建新合同开新会话去完成它。这会彻底改变你的 Agent 体验。七、用规则和 Skills 来塑造 Agent 的个性把 CLAUDE.md 当成一个逻辑目录而不是一篇文章。它的核心作用是在不同场景下告诉 Agent 去哪里找对应的规则或技能文件。规则Rules你不希望 Agent 做某件事就写成规则告诉它在做那件事前先读规则文件。规则可以嵌套、可以加条件——“如果在写代码读 coding-rules.md如果在写测试读 coding-test-rules.md如果测试失败读 coding-test-failing-rules.md”。Agent 会老老实实跟着走。Skills技能规则是编码偏好Skills 是编码方法。如果你有特定的做事方式把它写成 Skill。甚至可以让 Agent 先研究它会怎么解决某个问题然后把这个方案写成 Skill——你审核、修正等到真正遇到这个问题时它就按你认可的方式处理。随着规则和 Skills 增多性能会再次下降这很正常。规则越来越多开始互相矛盾或者 Agent 需要在开始写代码前读 14 个 markdown 文件上下文又开始膨胀了。解决方法定期清理。让 Agent去做个 spa把所有规则和 Skills 整合一遍删掉矛盾项向你确认最新偏好。清理完它又会感觉像魔法一样好用。这就是全部的秘密。保持简单用规则和 Skills把 CLAUDE.md 当目录对上下文和 Agent 的设计限制保持清醒的认知。假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】

别卷了，也别摆了：用百考通AI高效搞定毕业论文，或许是种新思路

高效，是让工具回归工具，让人回归思考。又一年论文季。朋友圈里，有人为查重率哀嚎，有人和格式排版“死磕”到凌晨三点，还有更多人对着空白的文档，陷入了“万事开头难”的永恒循环。这种“秃头式赶稿”的痛…

2026/6/3 21:18:20 阅读更多

用Python从头实现拉普拉斯变换：从数学公式到可视化频谱分析

用Python从头实现拉普拉斯变换：从数学公式到可视化频谱分析在信号处理领域，拉普拉斯变换就像一把瑞士军刀，它能将复杂的微分方程转化为简单的代数问题。想象一下，当你面对一个由电阻、电容和电感组成的电路时，直接求解…

2026/6/4 16:51:17 阅读更多

如何通过5个关键技术突破让Mac鼠标体验超越苹果触控板

如何通过5个关键技术突破让Mac鼠标体验超越苹果触控板【免费下载链接】mac-mouse-fix Mac Mouse Fix - A simple way to make your mouse better. 项目地址: https://gitcode.com/GitHub_Trending/ma/mac-mouse-fix Mac Mouse Fix是一款革命性的开源鼠标增强工具&#…

2026/6/2 10:31:54 阅读更多

从‘虚短虚断’到稳定性：给嵌入式软件工程师的运放选型与外围电路设计避坑指南

嵌入式工程师的运放实战指南：从参数解读到电路稳定作为一名长期与代码打交道的嵌入式软件工程师，第一次看到示波器上ADC采样值像心电图一样跳动时，我盯着屏幕足足愣了一分钟——寄存器配置正确、采样时序无误、代码逻辑经过反复验证&#xf…

2026/6/5 3:43:10 阅读更多

HOI研究避坑指南：HICO与HICO-Det数据集到底怎么选？看完这篇不再纠结

HOI研究避坑指南：HICO与HICO-Det数据集深度对比与选型策略当你在深夜实验室盯着屏幕，反复调试的HOI模型始终无法突破现有benchmark时，是否怀疑过问题可能出在数据集的选择上？作为计算机视觉领域最具挑战性的任务之一，人…

2026/6/5 3:42:50 阅读更多

跟着 MDN 学CSS day_49：定位实例练习从入门到精通

引言：定位知识的实践应用在掌握了CSS定位的基础理论之后，如何将这些知识应用于实际项目成为学习的下一个关键阶段。定位属性不仅仅是理论上的偏移和层叠，更是构建复杂交互界面的基石。本文将通过三个由浅入深的实例练习，从选项卡…

2026/6/5 3:41:49 阅读更多

Prometheus子查询性能调优指南：从‘能用’到‘敢用’的避坑实践（附avg_over_time优化案例）

Prometheus子查询性能调优指南：从‘能用’到‘敢用’的避坑实践当你的Prometheus控制台突然弹出"query processing would load too many samples into memory"的红色警告时，就知道子查询这个"性能刺客"又开始发威了。作为监控过数百…

2026/6/5 3:39:08 阅读更多

告别SQL语句！用Qt的QSqlTableModel在Windows上快速搞定学生信息管理（Qt5.15/6实战）

零SQL实战：用Qt的QSqlTableModel构建学生管理系统在桌面应用开发中，数据库操作往往是绕不开的一环。但对于许多刚接触Qt的开发者来说，SQL语法可能是一道令人望而生畏的门槛。好消息是，Qt提供了一个强大的工具——QSqlTableModel&a…

2026/6/5 3:39:08 阅读更多

保姆级教程：用DaVinci Configurator Developer从零搭建AUTOSAR OS（TC2xx三核实战）

三核AUTOSAR OS实战：从零构建TC2xx多核系统的完整指南在汽车电子领域，AUTOSAR OS作为嵌入式系统的核心，其配置过程往往让初学者望而生畏。本文将以Infineon TC2xx三核处理器为例，通过DaVinci工具链（Configurator &…

2026/6/5 3:39:08 阅读更多

利用claude code skill在快马平台快速构建个人博客原型

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请使用快马平台生成一个个人博客网站的原型。要求具备以下核心功能：响应式设计适配手机和电脑，包含首页文章列表展示，文章详情页，关…

2026/6/5 0:00:10 阅读更多

Gemma-4 E4B配置参数详解：如何优化模型性能和输出质量

Gemma-4 E4B配置参数详解：如何优化模型性能和输出质量【免费下载链接】gemma-4-E4B 项目地址: https://ai.gitcode.com/hf_mirrors/google/gemma-4-E4B Gemma-4 E4B是Google推出的先进多模态AI模型，支持文本、图像、音频和视频处理。本文将详细…

2026/6/5 0:00:10 阅读更多

AI 赋能下企业账户接管欺诈成因、风险与全维度防御体系研究

摘要：依托 Wintrust 金融集团发布的行业调研与美联储、FinCEN 公开统计数据，本文以美国 2022—2024 年账户接管欺诈（Account Takeover Fraud，ATO）损失逐年攀升的现实数据为切入点，系统梳理账户接管欺诈的定…

2026/6/5 0:00:52 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/4 9:21:37 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/4 7:15:04 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/4 9:21:48 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/4 9:21:45 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/4 9:21:52 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/4 9:21:53 阅读更多

相关文章

别卷了，也别摆了：用百考通AI高效搞定毕业论文，或许是种新思路

用Python从头实现拉普拉斯变换：从数学公式到可视化频谱分析

如何通过5个关键技术突破让Mac鼠标体验超越苹果触控板

从‘虚短虚断’到稳定性：给嵌入式软件工程师的运放选型与外围电路设计避坑指南

HOI研究避坑指南：HICO与HICO-Det数据集到底怎么选？看完这篇不再纠结

跟着 MDN 学CSS day_49：定位实例练习从入门到精通

Prometheus子查询性能调优指南：从‘能用’到‘敢用’的避坑实践（附avg_over_time优化案例）

告别SQL语句！用Qt的QSqlTableModel在Windows上快速搞定学生信息管理（Qt5.15/6实战）

保姆级教程：用DaVinci Configurator Developer从零搭建AUTOSAR OS（TC2xx三核实战）

利用claude code skill在快马平台快速构建个人博客原型

Gemma-4 E4B配置参数详解：如何优化模型性能和输出质量

AI 赋能下企业账户接管欺诈成因、风险与全维度防御体系研究

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因