文 /蒋涛CSDN 创始人本文为《硅基时间》系列之一。作为一个从业三十年的程序员老兵我们正在亲历有史以来最大的一场科技革命。我想认真记录 AI 正在带来的时代趋势以及程序员这个行业正在经历的深层变迁。写这一篇是因为我连着读了四份材料越读越坐不住读到最后一份才松了一口气。一份是 Andrej KarpathyOpenAI 联合创始人、「vibe coding」一词的发明人年末在 X 上发的一句话——「我从未像现在这样觉得自己作为一个程序员如此落后。」一份是一篇关于中国大厂程序员真实精神状态的报道记录了一群人正在经历的「AI 分裂症」。一份是「龙虾之父」Peter Steinberger知名 iOS 开源开发者、PSPDFKit 创始人后加入 OpenAI自己在 X 上晒出的账单——一个人一个月烧掉 940 万元的 token。前三份全是焦虑。直到我读到第四份——OpenAI 一场内部分享的实录主题叫Vibe Engineering。它没有否认焦虑但它指出了焦虑的出口在哪。四份材料拼在一起拼出了一张我没料到的图。我原以为程序员对 AI 的焦虑是「菜鸟怕被淘汰」。读完才发现根本不是。焦虑的不是被淘汰的人。是跑在最前面的人。接下来大约 8000 字我会顺着这四份材料往下走——从山顶的人为什么先恐慌到同一栋写字楼里的分裂症到一场没人喊停的军备竞赛最后到 OpenAI 内部那个把所有焦虑一刀劈开的词。读完你会拿到一个判断决定你是被 AI 放大还是被 AI 替代的不是你跑得多快是一个分水岭。01 · 我读到 Karpathy 那句话停了很久先说清楚 Karpathy 是谁这句话才有分量。他是 OpenAI 的联合创始人之一是「vibe coding」这个词的发明人——这个词现在全世界都在用。他是公认的大神里的大神。如果 AI 编程时代有一座金字塔他站在塔尖。就是这个人在年末说了这句话「我从未像现在这样觉得自己作为一个程序员如此落后。」我读到这里停了很久。因为这句话的杀伤力不在于「难」在于「谁说的」。一个新手说自己落后正常一个塔尖的人说自己落后那意味着——这座山根本没有山顶或者说山顶每天都在往上长。Karpathy 说编程这个职业正在被彻底重构程序员自己写的代码越来越少更多是在各种工具之间「串联」。他列了一长串新的可编程抽象层得全部重新掌握:agents、subagents、提示词、上下文、内存、权限、工具、插件、技能、钩子、MCP、LSP、斜杠命令、工作流、IDE 集成……他打了个比方我觉得是这两年关于 AI 最准的一个——这就像一个强大的外星工具被分发给所有人但没有说明书。每个人都得自己摸索怎么用。而这场变革他形容是给整个行业带来「9 级大地震」般的冲击。这条帖子2.2 万点赞3000 多转发360 万浏览。评论区里挤满了同样睡不着的人。我注意到一个细节比 Karpathy 本人那句话更扎心。Anthropic 的资深工程师 Boris Cherny 在评论区说上个月他作为一个工程师第一次完全没打开 IDE全靠 Opus 4.5 写了大约 200 个 PR每一行代码都是 AI 生成的。一个顶级工程师一个月没碰过编辑器。而他补了一句更值得琢磨的观察:新来的应届毕业生因为脑子里没有那一大堆「模型能做什么、不能做什么」的先入之见反而最会用模型。过去老手的「经验」是护城河。现在老手的「经验」可能是包袱。这就是为什么连山顶的人都在恐慌——他们要扔掉的恰恰是过去让他们站上山顶的那套东西。那山脚下的人呢我翻开了第二份材料。02 · 同一栋写字楼两种宗教钛媒体最近有一篇报道标题就一个词——分裂症。它写的是 2026 年春天中国大厂程序员真实的样子。我读的时候几次想合上电脑因为太真了。派别 A · 走出洞穴的「拜神者」一个叫刘昊的后端工程师春节的一次偶然尝试——用一句话让 AI 在 2 小时内完成了原本要 7 天的开发。从那天起他三个月没休过周末。一个月里给自己的 Agent 塞了 600 多个并行任务覆盖 20 多个场景攒了 100 多个 skill。每天站在电脑前超过 16 小时每月烧掉的 token 超过 1 万元而且数字还在飞涨。值得一提的是这群人敢这么狠地烧 token很多时候是在薅公司的算力羊毛——用的是大厂内部自研助手或企业报销账号。记住这个细节它在第 04 节会和「大厂禁用第三方工具」撞出一个很矛盾的画面。另一个叫周默的长期开着 10 个以上对话框第三周睡眠压到每天 4 小时茶饭不思和记者见面时要靠一杯全糖奶茶才能止住微微发抖的手。最刺眼的是他那句话——他觉得人类的生理极限已经在限制 AI 进化的速度「AI 们都在等他他就是它们最大的瓶颈。」你品一下这句话。一个人把自己活成了一群 AI 的瓶颈。派别 B · 固守阵地的「清醒者」但就在同一栋写字楼里另一批人正以同样坚定的姿态走向完全相反的方向。一个在公司干了十几年的老程序员严格禁止他的小组用 AI Coding。在他眼里好程序员的代码是作品能看出这个人的思考、认知、风格。而 AI 写的代码像一篇东拼西凑的文章可能同时有 5 种风格他叫它「拼接怪」。另一个叫田明的资深程序员把 AI 写的代码叫「屎山」——能实现简单功能但不考虑结构和扩展性给后续埋下巨大隐患。他的判断是:「如果想要 AI 写出结构完善的代码耗费的精力和 token还不如自己弄。」这种精神状态那篇报道里有一句概括我觉得精准得可怕——他们一面坚信 AI 是通往神权的阶梯一面抱怨 AI 是一座不断堆积的屎山。同一栋楼同一个工种同一个时代。一边在拜神一边在骂街。这就是分裂症。但读到这里我意识到「狂热」和「抵触」其实不是重点——它们只是同一种东西的两个表情。真正的重点藏在中间那个谁都没躲过的东西里。03 · 残酷真相你以为你在指挥 AI其实你的肌肉在退化这一节是这篇文章最冷的地方。我犹豫过要不要写但我觉得必须写。Anthropic 今年 1 月有一篇论文。一项随机对照试验让程序员学一个新的编程库。结果——用 AI 辅助的那组成绩比纯手写的那组平均低了 17%。而且最依赖 AI、当甩手掌柜、用 AI 盲目试错的人成绩最低。论文给这种退化起了个名字叫认知卸载。意思是:程序员把理解、调试这些核心任务卸载给了 AI于是失去了通过报错、卡壳、摩擦来建设认知的机会。一句话——编程肌肉萎缩了。我读到这儿后背有点发凉。因为它揭示了一件比「失业」更隐蔽的事。我们一直担心的是「AI 替我做事我会不会丢了工作」。但这篇论文说的是另一回事AI 替你做事的同时正在悄悄改变你「用脑子」的方式。报道里新加坡的资深架构师丁洋说自己生成的代码量在大爆发但越来越「只想提要求不想亲自动手了」。还有程序员说得更伤感——「只想读代码、放弃写代码的自己不完整了」好像「有一部分自我已经流失了」。这就是认知卸载最隐蔽的地方它发生的时候你感觉是变强了。你产出更多、更快、更轻松。你以为你升级成了「指挥官」。但你可能不是指挥官。你可能是一个正在忘记怎么打仗的将军。我必须说句公道话——认知卸载不是 AI 的错是「怎么用」的错。同样这篇论文也说明那些不当甩手掌柜、坚持理解每一步的人受影响小得多。所以问题从来不是「用不用 AI」是「你在用 AI 的过程里到底还在不在思考」。这恰好印证了我一直讲的那句话AI 时代真正稀缺的不是产出能力是判断力。而判断力这块肌肉恰恰是最容易在「认知卸载」里悄悄萎缩的。但更让我坐不住的还不是这块萎缩的肌肉。是它背后一个更大的结构性问题——一个让我想起两百年前那场革命的历史类比。04 · 那一刀今天的程序员会不会是新的纺织女工先看一组数字我反复看了三遍。Greptile 的报告开发者月代码提交量过去一年增长了 76%。综合谷歌、Anthropic 等公司的数据AI 至少把开发者提交 PR 的平均时间缩短了 30%。效率确实涨了。但有一个细节常被忽略——省下来的时间最终还要「还回去」。科技公司往往比员工更早算好了「AI 时代的合理工作量」而这个新工作量远超以往。一句话AI 帮你省了 30% 的时间公司给你加了 76% 的活。这让我想起一个让我合上电脑想了很久的类比。19 世纪初的英国纺织业。珍妮纺纱机出现手工女工的效率提升了几十倍。但工厂主没有因此让工人少干、多拿——相反他们要求工人操作更多的机器、产出更多的纱线。最后纺织女工的工作强度不降反升。而她们的技能在机器的标准化操作里逐渐退化——从需要技艺的工匠变成了只需要重复动作的「机器附庸」。于是一个问题摆在面前今天的程序员会不会成为新的纺织女工这一刀砍在了我整个思考体系的命门上。因为我一直在讲一个核心观点AI 不是在提效是在造时间。一个程序员配上 Agent 矩阵等于凭空多出了几十个、上百个并行的「硅基分身」多出了过去不可能存在的时间。这个判断我至今相信。但纺织女工这个类比逼我补上一个我之前没正面回答的问题——AI 造出来的时间归谁如果硅基时间被造出来却全部被组织收走、变成更高的产出指标、更密的工作排期那程序员拿到的就不是自由是一条更长的鞭子。时间是多了但它不属于造它的人。这是「硅基时间」这个概念必须诚实面对的影面。造时间是真的。但谁拿走这些时间是另一场战争。还有一个被反复记录的吊诡大厂一边在招聘里疯狂要求 AI Coding 能力一边在内部对第三方 AI 工具设重重限制怕代码泄露。一边公关上高喊拥抱 AI一边一线员工说「从头到尾没接到过任何指令要加大 AI 使用」。这就和第 02 节那个细节对上了——刘昊们之所以敢疯狂烧 token是在薅公司内部自研助手的算力羊毛而一旦想用外面更强的第三方工具立刻撞上合规的墙。于是一线程序员被夹在中间公司既要你用 AI 卷出产能又怕你用 AI 漏了代码。内卷和合规在同一个人身上打架。公司展现的姿态像是在为「AI 替代程序员」做舆论准备。而真实的内部AI 还只是程序员的自发探索。最深的裂缝原来不在人和 AI 之间。在人和组织之间。写到这儿我想把节奏放慢一下。那天晚上我关掉电脑的时候想起一个画面。此刻的写字楼里应该还亮着不少灯。有人在让 Agent 跑一整夜的测试有人悄悄关掉了 AI、想找回自己写代码的手感有人盯着 token 余额睡不着觉怀疑自己是不是已经落后了。也还有很多人根本没意识到——时代已经换了一种走法。同一栋楼同一盏盏灯底下是完全不同的几种人生。焦虑、亢奋、抵触、茫然没有谁对谁错都只是被同一场地震晃到的普通人而已。我说这些是想在往下走之前提醒一句接下来的故事会更极端。但再极端的数字背后站着的也都是这样具体的人。那么那些看清了「时间被组织收走」这件事、决定不再当纺织女工、干脆自己跳出去的人后来怎么样了这是第三份材料的主角。05 · 军备竞赛一个人一个月940 万元 token第三份材料主角还是开头提过的「龙虾之父」Peter Steinberger绰号来自他那个爆火的 AI 编程项目 OpenClawclaw 是龙虾钳来自他自己在 X 上晒出的一张后台截图。那张截图上的数字离谱到我瞪大了眼睛——过去 30 天调用 OpenAI API 总费用130 万美元约合 940 万元人民币消耗6030 亿token发起760 万次请求每日请求量20.6 万次折算下来每秒调用 2.4 次有编程背景的人看到这个数字第一反应大概是「假的吧单人怎么烧得掉 130 万美元」。虾爹自己解释了——这不是拿来做什么大规模训练纯粹是他开了「快速模式」、让上百个 Codex 高频并发地跑推理为的是让这些 Agent 持续、激进地协作。他还补了一句关掉快速模式成本能立刻降 70%——也就是说这 940 万里有一大半是他主动为「快」付的溢价。这是一个人的账单。他的团队只有 3 个人。但他有庞大的硅基外援——同时在云端运行约 100 个 Codex。这些 Agent 自动 Review PR、扫安全漏洞、查重 Issue、写修复程序、监控 Benchmark甚至能监听会议内容然后自己创建 PR。最妙的是结构一些 Agent 负责干活另一些 Agent 负责盯着其它 Agent 干活。员工从人类逐渐变成了 AI Agent。这画风不就是一家真正的软件公司吗?面对「月烧 130 万美元」的质疑虾爹的回应特别能代表这个时代的逻辑。他说这压根不算贵——因为他不是拿 Codex 和「工具成本」比是拿它和「工程团队成本」比。我们替他把这笔账算一下你就懂这个逻辑有多狠。就算按他「关掉快速模式」的省钱版本算一个月也还要约 40 万美元。而在旧金山一个高级工程师 / 架构师的月薪大约 1.5 万美元。40 万除以 1.5 万——虾爹一个人一个月的 token 账单约等于传统时代一个带 25 到 30 人的工程师 Leader手下整支团队一个月的人力成本。一个人烧出一支团队。而且 token 还在变便宜团队却只会变贵。所以在他眼里这笔账不是「贵得离谱」是「便宜得离谱」——他用一个人的调度换来了过去要二三十个工程师才能干的活。OpenAI CEO 奥特曼Sam Altman说未来会是一个「extremely multi-agent」的世界。虾爹治下已经有那个味道了。这就是我们一直讲的那个判断的极端样本软件开发正在从「人类使用工具」变成「人类管理 Agent 团队」。一个 OPD调度一支硅基军团。但我想说的不是这个故事多励志。我想说的是它和前两份材料拼在一起露出了一个更冷的真相。Karpathy 焦虑「跟不上」。报道里那群人焦虑「被组织收割」。而虾爹这种最前沿的玩家,把焦虑变成了一场军备竞赛——谁的 Agent 多谁的 token 烧得狠谁就跑得快。还有一个关于卡帕西的细节他现在跑完 Codex 就切 Claude力争最大化各平台吞吐量一看到 token 额度有剩余就焦虑。这种情况在硅谷已成新常态——工程师把 token 使用率当成 KPI把「用不完额度」视为能力不足。过去焦虑是「我会不会被淘汰」。现在焦虑是「我的 token 烧得够不够狠」。焦虑没有消失。它只是从「怕落后」升级成了「停不下来」。读到这里前三份材料其实抛出了同一个问题Karpathy 怕跟不上一线的人怕被收割虾爹陷在停不下来的竞赛里——他们问的都是同一句话AI 时代一个程序员到底该怎么办?我一直没找到一个让我信服的答案。直到读到第四份材料。06 · 解药OpenAI 内部那个把焦虑劈开的词第四份材料是 OpenAI 一场内部分享的实录。讲的人是两位Romain Huet——OpenAI 开发者体验Developer Experience负责人之前在 Twitter 和 Stripe 做了多年开发者平台还有 Aaron Friel——OpenAI 技术团队的工程师正是他在 OpenAI DevDay 上演示了「让 Codex 跑七小时完成一个项目」。主题只有一个词——Vibe Engineering。先看一组让人坐直的数据OpenAI 内部工程师对自家 Codex 的采用率超过 92%所有内部 PR 都由 Codex 审核用 Codex 的工程师产出的合并 PR 比不用的人多 70%。但真正劈开我前面所有焦虑的是 Friel 讲的一句话——代码行数越来越便宜了。但证明代码有效这件事越来越贵了。我读到这句前面三份材料的雾一下散了。因为它精确地指出了AI 时代到底什么在贬值什么在升值。会写代码贬值能证明代码是对的升值。Karpathy 焦虑的「落后」本质就是没及时完成从前者到后者的转身。Romain 讲了一个故事把「证明代码有效越来越贵」这句话钉死了。几周前在伦敦他和一家公司的 CTO 并排坐着。他没有去说服对方「换我们的工具」只做了一件事打开 Codex 的代码审查功能挑了一个这家公司最近刚刚合并进生产环境的随机 PR让 Codex 看一眼。结果 Codex 当场揪出两个重大 bug——连他们最资深的工程师都漏掉了的 bug而他们正在生产环境里到处追这个 bug 的源头。代码是这些资深工程师写的。但「证明这段代码到底对不对」他们没做到Codex 做到了。Romain 说那一刻 CTO 的反应是:如果我不用这个东西我会落后。Friel 也讲了同一件事的内部版本——OpenAI 所有的 PR 现在都由 Codex 审真的拦下过一些会冲进生产环境的复杂 bug。这就是「信任越来越贵」最具体的样子当写代码变得几乎免费整个行业的重心正在从「谁能写出来」挪到「谁能证明它是对的」。Friel 现场演示了一个故事是这整套逻辑最好的注脚。他让 Codex 把一个 Kotlin 项目用 Rust 从零重写要求 100% 兼容。起点是一个空目录里面只有一个 prompt 文件。他把 prompt 贴进去然后——就等着。Codex 做的第一件事不是写代码。它先创建了一个叫「watchdog」的子代理专门负责提醒主代理「你的目标是什么、用户要的是什么」防止跑偏。然后它启动一堆子代理并行干活有的研究上游代码有的调研版本差异有的设计架构。所有进度都写进一个叫「exec plan」的文件——不只给模型看也给人看。这个任务工程师手写大概要几周。Codex 跑了一晚上大概 12 小时。还有一个更出名的版本Friel 有次在沙发上边看电视边把电脑设成不休眠让 Codex 跑一个任务。第二天醒来发现它还在跑——7 小时200 多轮迭代最后产出一个大约 500 行的 diff。很多工程师听到这个数字第一反应是「完了写了 10 万行垃圾吧?」但事实相反。这是一个非常复杂的改动而 Codex 把绝大部分时间花在了跑测试、改测试、再跑测试上。最后这个小小的 diff被 merge 了。我必须停下来点一句因为这正好接住了我在第 03 节抛出的那个冷数据——还记得吗Anthropic 那篇论文里AI 辅助组成绩低了 17%最依赖 AI、盲目试错的人成绩最低。那叫认知卸载。可 OpenAI 这个 7 小时 500 行的故事明明也是重度用 AI为什么结果相反?差别不在用不用 AI。差别在AI 跑得越多你是把「证明它对」的责任也卸载掉还是反而抓得更紧。低 17% 的那组是让 AI 随便写、然后祈祷测试能过。OpenAI 这组是 AI 写得越多人在「正确性」上投入越重——大部分算力花在测试和验证上。同样是重度用 AI一个在卸载认知一个在加固认知。这个区分有名字。Simon Willison——Web 框架 Django 的联合创始人、在开发者圈极有影响力的独立开发者和博主——提出了「Vibe Engineering」这个词专门用来跟「Vibe Coding」划清界限模式核心特征结局Vibe Coding让模型随便写然后祈祷测试能过甩手掌柜被替代——认知卸载肌肉萎缩Vibe Engineering对每一行代码负责但规划、架构、调试每个环节都重度调度 Agent被放大——成为 Director一句话压舱要用 AI 构建也要保持人类的责任。我看到这儿前面所有的裂缝、所有的分裂症瞬间归位了——焦虑的人大多在做 Vibe Coding。被放大的人都在做 Vibe Engineering。前面那个骂「屎山」的田明骂的是 Vibe Coding;狂热到睡 4 小时的周默也困在 Vibe Coding 的亢奋里。而 OpenAI 这套是把同一个 AI用成了完全不同的东西。那么 Vibe Engineering 时代什么变重要了?Romain 讲得毫不含糊他点了三样——设计与品味taste、判断力discernment、清晰的沟通。还有一样我特别认同产出让人类愿意读的东西。Friel 有个测试标准,我觉得可以刻在每个团队的墙上——如果 Codex 的产出是你自己都不想读的东西那它对下一个 AI 代理也不会有用。所以他们逼工程师多写文档、多写测试。理由不是老一套的「规范」而是:这些东西不只给人看是给下一个接手代码库的 AI 看的。这正是我一直讲的「底表化」——把判断和标准沉淀成 AI 能反复调用的东西。OpenAI 叫它「给 AI 看的文档」一回事。还有两个细节是「从写代码到调度 Agent」最硬的官方实证。一个是角色变了。Friel 开玩笑说现在工程师都成了 Manager——不自己写代码而是给 Codex 派任务、审产出。但 Codex 还会自己创建子代理、给子代理派活所以更准确地说——大家都成了 Director。另一个叫「Best of N」给 Codex 一个任务它并行尝试 4 种方案把 4 个结果都给你你挑最顺眼的再继续。Friel 有个我特别喜欢的说法——你其实是在用代码具身一套进化算法试很多、选赢家、带着赢家往前、再生新变体。而且就连那个 Kotlin 重写 Rust 的复杂任务单次成功率都超过 75%并行打几个再挑一个成功率高得惊人。这正是我反复讲的别问「怎么让 AI 帮我写这段」要问「怎么让几个 Agent 并行跑几条路、最后我挑一个」。前者是加法后者是乘法——OpenAI 把它做成了一个按钮。讲到这儿我必须回到第 03 节那个最扎心的恐惧——如果 AI 把代码都写了我的编程肌肉会不会萎缩?这场分享的最后一个观众提问问的正是这个工程师怎么才能不「手生」?Friel 的回答我觉得是整场分享里最该被程序员记住的一段。他给了三个具体做法——第一代码可以不写但必须读得懂。他说当代码变便宜「至少能读懂这段代码在干什么」反而变成了底线能力。他现在大部分时间花在读 AI 的输出、读懂、确认它对不对上。读不是退化。读是新的写。第二看到不懂的就追问到底。Codex 用了一个他不熟的技巧他不会划过去而是追问它「为什么这么做、底层到底在干什么」。他说这反而让他成了一个更敏锐more discerning的工程师——判断力不是在用 AI 中萎缩的是在「追问 AI」中练出来的。第三最生动的一个例子OpenAI 新上任的 HR 负责人 Joaquin主动退一步去当了四个月的实习生——就为了重新钻回写代码的一线把手感找回来。一个高管为了不脱离一线甘愿去做实习生。认知卸载不是 AI 时代的宿命。它是「只用不读、只要不问」的人的宿命。这正好回答了我在第 03 节没敢下结论的那个问题。退化是真的但它不是必然的。读代码、追问 why、不脱离一线——这就是在 Vibe Engineering 时代把肌肉留住的三个动作。所以,这场地震的解药其实就一句——别做 Vibe Coding 的赌徒去做 Vibe Engineering 的 Director。代码越来越便宜所以别再靠「写代码」证明自己——靠「证明代码有效」靠品味、判断力和让 AI 愿意读的表达。Hold Light and Shade · 这场地震的另一面Vibe Engineering 给了方向但我不想把这篇写成一支解药广告。所以我必须把光和影都摆出来否则就是另一种不诚实。光的一面是真的。Karpathy 说用对了这些新东西一个程序员能变强 10 倍。虾爹证明了一个人真的能调度上百个 Agent干出一家公司的活。能力的天花板被实实在在地顶高了。影的一面也是真的。那篇报道里有一个细节我觉得是整篇最清醒的一句。一位影视从业者说玩票的人只会无脑为新工具拍案叫绝而真正知道自己想要什么的人永远会感到不满足——但他们才是 AI 最核心的使用者是高质量内容的产出者。这句话翻译过来就是——AI 把「产出」变得极其便宜。于是「知道自己想要什么」变成了唯一的奢侈品。刘昊做了一堆东西后来回看「很多没什么价值也不像是自己想做的」。丁洋激动之余做出的东西「更像是突然被赋予某种能力后不得不发挥一通」。这是这场狂热里最安静、也最值得听的一个声音当放大变得免费没有方向的放大只是更快地制造噪音。光和影是同一件事的两面。门槛被砸平是光正因为人人可得它不再是护城河你唯一能守的退回到了「你到底想做什么、什么值得被做出来」——这是影也是这场地震对每个人最公平、也最严苛的考题。对你意味着什么分几种人对号入座。落点只有一个从 Vibe Coding 走到 Vibe Engineering。对一个正在狂热的程序员像刘昊、周默你跑得很快但停下来问一句——你做的这些东西有多少是「你真正想做的」有多少只是「AI 能做所以你就做了」把睡眠还给自己把方向感找回来。OpenAI 的人提醒过:进度单位不是代码行数是置信度。你是 Agent 的 Director不该是它们的瓶颈更不该是它们的附庸。对一个抵触 AI 的程序员像田明你对「屎山」和「认知卸载」的警惕是对的这份清醒很珍贵——你警惕的其实正是 Vibe Coding。但别把「警惕」变成「拒绝」。Vibe Engineering 就是为你这种人准备的:对每一行代码负责但在规划、架构、调试、文档每个环节都用上 Agent。你担心的退化是真的但躲开 AI 不能解决它把 AI 用成加固判断的工具才能。对一个普通工程师别被「跟不上」吓住。Karpathy 说得很清楚——过去 30 天没跟上的人观点就过时了但这也意味着这场竞赛每个月都在重新发牌没有人能靠老资历一直领先。最该练的不是手速是 OpenAI 点的那三样品味、判断力、把话说清楚。从今天起逼自己写「连下一个 AI 都愿意读」的文档和测试——这就是你的底表。对一个管理者 / CEO前面那个纺织女工的类比是给你看的。如果你只想用 AI 把员工的产出指标拉到 76% 的增长你会得到一批高效但麻木、最终技能退化的「机器附庸」以及一场你迟早要付代价的人才流失。真正该考核的不是谁的 token 烧得多是谁的产出置信度高。AI 造出来的时间怎么分配决定了你是在养 Director还是在造怨气。数字浓缩17%· AI 辅助组比纯手写组低的成绩——Vibe Coding 的代价940 万元· 一个人一个月烧掉的 token——焦虑变成军备竞赛76%· 用 Codex 的工程师多产出的合并 PR——Vibe Engineering 的红利7 小时 / 500 行· 大部分时间花在测试上——新的进度单位是置信度1 个词· Vibe Coding 还是 Vibe Engineering——被替代和被放大的分水岭我还没想清楚的事读完这四份材料有一件事我一直没想通摊出来跟你一起想。Vibe Engineering 是个好答案它解决了「怎么用 AI 才不会退化」。但它解决不了我在第 04 节抛出的那个问题——造时间和分时间是两回事。你可以是一个最自律、最讲究的 Vibe Engineering Director每一行代码都对它负责把品味和判断练到极致。但如果你头顶的组织只是把你这套本事换算成「那你一个月该交 76% 更多的 PR」那 Vibe Engineering 救得了你的代码质量救不了你的生活。它是一套关于「怎么把活干好」的方法论不是一套关于「时间归谁」的答案。Karpathy 的焦虑、一线的分裂、虾爹的军备竞赛本质上是同一件事——当 AI 把产能的上限彻底打开「人该工作到什么程度」这个问题第一次失去了天然的边界。过去边界是人的生理极限你一天只能写 8 小时代码。现在你可以指挥 100 个 Agent 7×24 小时跑。那么新的边界在哪里是公司的产出指标是同行烧 token 的速度还是一个人自己决定「我今天就到这儿」的能力?我担心的是,在一个产能没有上限的世界里如果一个人没有能力为自己设定边界那这个边界就会由别人来替他设——而别人设的边界永远比他自己设的更狠。这不是 AI 的问题也不是 Vibe Engineering 能解的题。说来讽刺——OpenAI 那场分享的开场白就是很多工程师都梦想有一个「永远不会累的同事」而 Codex 就坐在那个位置上。说这话的人是当一件大好事在说的。但前面那些睡 4 小时、发着抖的人提醒我们——一个永不疲倦的同事对一个会疲倦的人到底是解放还是逼问取决于谁说了算「今天到此为止」。写到最后我反而想把话收得简单一点。这篇从头到尾焦虑、分裂、军备竞赛、解药、影面绕了一大圈。但如果只留一句我想留的是——AI 可能永远不会累。但人会。所以未来真正稀缺的能力也许不是让 Agent 跑得更快、更久而是在一片「还能再跑一会儿」的轰鸣里有人能清醒地知道自己要去哪儿以及什么时候该关灯回家。会有一批程序员被这场焦虑吞掉。但那些既会用 Vibe Engineering 把活干好、又守得住方向、还舍得在该停时关灯的人会赢。毕竟未来的竞争从来不是人和 AI 比谁不知疲倦——而是看谁更清楚自己到底想用这些多出来的时间去换些什么。────────────────────//作者手记这一篇本来不在计划里。是连读 Karpathy 的帖子、一篇关于大厂程序员的报道、龙虾之父、再到 OpenAI 那场 Vibe Engineering 分享四份材料堆在一起实在坐不住临时写的。写的时候我对「认知卸载」和「纺织女工」这两段最舍不得也最犹豫。因为它们戳的是我自己这套「硅基时间」体系的软肋——我一直在讲造时间的红利却很少正面讲「这些时间归谁」。我决定把这个影面诚实地补上而不是绕过去。读到 Vibe Engineering 时我松了口气因为它给了焦虑一个出口但写到最后我又收住了——它能解代码的题解不了「时间归谁」的题。这两件事我都想说清楚。一个聪明的读者大概会问你前面几篇都在讲 AI 造时间的红利这篇却在讲焦虑和影面是不是打自己的脸我想说的是——红利和代价从来是同一枚硬币。只讲红利的人要么没看清要么在卖课。补一句关于材料的话。第四份材料我特意找到了一手出处——不是别人转述的二手稿是 OpenAI Forum 那场分享 Romain Huet、Aaron Friel、以及主持人 Chris NicholsonOpenAI 全球事务团队成员、活跃的 Codex 用户的逐字发言实录。伦敦那个 CTO 的两个 bug、75% 的成功率、Joaquin 去当四个月实习生这些最有力的细节都藏在一手实录里二手转述全删掉了。这也算是这篇文章自己的一个小注脚在一个信息被反复转述、压缩、再加工的时代回到一手本身就是一种判断力。本文引用的关键外部资料来源由最新一代 Claude 核心模型协助核查:Karpathy 言论及评论区Andrej Karpathykarpathy、Boris Cherny X 原帖认知卸载论文Anthropic 2026 年 1 月、屎山、纺织女工类比、Greptile 提交量与大厂态度等事实引自一篇关于大厂程序员的报道《程序员们的「AI 分裂症」》钛媒体龙虾之父 token 账单Peter SteinbergersteipeteX 原帖Vibe Engineering、7 小时 500 行、Best of N、75% 成功率、92%/70% 数据、伦敦 CTO、Joaquin 实习生OpenAI Forum 分享一手实录Romain Huet / Aaron Friel / Chris Nicholson 发言;「Vibe Engineering」一词由 Simon Willison 提出AI 能力增长数据Epoch AI Capabilities IndexECI下一期答问录回到 Token 经济——从 L1 算力底座到 L6 最终用户的五层生态。这场关于「时间归谁」的讨论我也想继续。欢迎在留言区接着聊。────────────────────《硅基时间》系列持续更新中。记录 AI 带来的时代趋势洞察与程序员行业的深层变迁。如果这篇对你有用欢迎扫码关注第一时间读到下一篇。AI 不是提效是造时间。扫码关注「硅基时间」——蒋涛 · CSDN推荐阅读硅基时间万字长文答问录一码盲消失OPD 崛起新市场在哪里Anthropic万亿美元估值背后真正的红利是什么
连 Karpathy 都开始恐慌:AI 正在重新定义「程序员」| 硅基时间
发布时间:2026/5/26 23:18:01
文 /蒋涛CSDN 创始人本文为《硅基时间》系列之一。作为一个从业三十年的程序员老兵我们正在亲历有史以来最大的一场科技革命。我想认真记录 AI 正在带来的时代趋势以及程序员这个行业正在经历的深层变迁。写这一篇是因为我连着读了四份材料越读越坐不住读到最后一份才松了一口气。一份是 Andrej KarpathyOpenAI 联合创始人、「vibe coding」一词的发明人年末在 X 上发的一句话——「我从未像现在这样觉得自己作为一个程序员如此落后。」一份是一篇关于中国大厂程序员真实精神状态的报道记录了一群人正在经历的「AI 分裂症」。一份是「龙虾之父」Peter Steinberger知名 iOS 开源开发者、PSPDFKit 创始人后加入 OpenAI自己在 X 上晒出的账单——一个人一个月烧掉 940 万元的 token。前三份全是焦虑。直到我读到第四份——OpenAI 一场内部分享的实录主题叫Vibe Engineering。它没有否认焦虑但它指出了焦虑的出口在哪。四份材料拼在一起拼出了一张我没料到的图。我原以为程序员对 AI 的焦虑是「菜鸟怕被淘汰」。读完才发现根本不是。焦虑的不是被淘汰的人。是跑在最前面的人。接下来大约 8000 字我会顺着这四份材料往下走——从山顶的人为什么先恐慌到同一栋写字楼里的分裂症到一场没人喊停的军备竞赛最后到 OpenAI 内部那个把所有焦虑一刀劈开的词。读完你会拿到一个判断决定你是被 AI 放大还是被 AI 替代的不是你跑得多快是一个分水岭。01 · 我读到 Karpathy 那句话停了很久先说清楚 Karpathy 是谁这句话才有分量。他是 OpenAI 的联合创始人之一是「vibe coding」这个词的发明人——这个词现在全世界都在用。他是公认的大神里的大神。如果 AI 编程时代有一座金字塔他站在塔尖。就是这个人在年末说了这句话「我从未像现在这样觉得自己作为一个程序员如此落后。」我读到这里停了很久。因为这句话的杀伤力不在于「难」在于「谁说的」。一个新手说自己落后正常一个塔尖的人说自己落后那意味着——这座山根本没有山顶或者说山顶每天都在往上长。Karpathy 说编程这个职业正在被彻底重构程序员自己写的代码越来越少更多是在各种工具之间「串联」。他列了一长串新的可编程抽象层得全部重新掌握:agents、subagents、提示词、上下文、内存、权限、工具、插件、技能、钩子、MCP、LSP、斜杠命令、工作流、IDE 集成……他打了个比方我觉得是这两年关于 AI 最准的一个——这就像一个强大的外星工具被分发给所有人但没有说明书。每个人都得自己摸索怎么用。而这场变革他形容是给整个行业带来「9 级大地震」般的冲击。这条帖子2.2 万点赞3000 多转发360 万浏览。评论区里挤满了同样睡不着的人。我注意到一个细节比 Karpathy 本人那句话更扎心。Anthropic 的资深工程师 Boris Cherny 在评论区说上个月他作为一个工程师第一次完全没打开 IDE全靠 Opus 4.5 写了大约 200 个 PR每一行代码都是 AI 生成的。一个顶级工程师一个月没碰过编辑器。而他补了一句更值得琢磨的观察:新来的应届毕业生因为脑子里没有那一大堆「模型能做什么、不能做什么」的先入之见反而最会用模型。过去老手的「经验」是护城河。现在老手的「经验」可能是包袱。这就是为什么连山顶的人都在恐慌——他们要扔掉的恰恰是过去让他们站上山顶的那套东西。那山脚下的人呢我翻开了第二份材料。02 · 同一栋写字楼两种宗教钛媒体最近有一篇报道标题就一个词——分裂症。它写的是 2026 年春天中国大厂程序员真实的样子。我读的时候几次想合上电脑因为太真了。派别 A · 走出洞穴的「拜神者」一个叫刘昊的后端工程师春节的一次偶然尝试——用一句话让 AI 在 2 小时内完成了原本要 7 天的开发。从那天起他三个月没休过周末。一个月里给自己的 Agent 塞了 600 多个并行任务覆盖 20 多个场景攒了 100 多个 skill。每天站在电脑前超过 16 小时每月烧掉的 token 超过 1 万元而且数字还在飞涨。值得一提的是这群人敢这么狠地烧 token很多时候是在薅公司的算力羊毛——用的是大厂内部自研助手或企业报销账号。记住这个细节它在第 04 节会和「大厂禁用第三方工具」撞出一个很矛盾的画面。另一个叫周默的长期开着 10 个以上对话框第三周睡眠压到每天 4 小时茶饭不思和记者见面时要靠一杯全糖奶茶才能止住微微发抖的手。最刺眼的是他那句话——他觉得人类的生理极限已经在限制 AI 进化的速度「AI 们都在等他他就是它们最大的瓶颈。」你品一下这句话。一个人把自己活成了一群 AI 的瓶颈。派别 B · 固守阵地的「清醒者」但就在同一栋写字楼里另一批人正以同样坚定的姿态走向完全相反的方向。一个在公司干了十几年的老程序员严格禁止他的小组用 AI Coding。在他眼里好程序员的代码是作品能看出这个人的思考、认知、风格。而 AI 写的代码像一篇东拼西凑的文章可能同时有 5 种风格他叫它「拼接怪」。另一个叫田明的资深程序员把 AI 写的代码叫「屎山」——能实现简单功能但不考虑结构和扩展性给后续埋下巨大隐患。他的判断是:「如果想要 AI 写出结构完善的代码耗费的精力和 token还不如自己弄。」这种精神状态那篇报道里有一句概括我觉得精准得可怕——他们一面坚信 AI 是通往神权的阶梯一面抱怨 AI 是一座不断堆积的屎山。同一栋楼同一个工种同一个时代。一边在拜神一边在骂街。这就是分裂症。但读到这里我意识到「狂热」和「抵触」其实不是重点——它们只是同一种东西的两个表情。真正的重点藏在中间那个谁都没躲过的东西里。03 · 残酷真相你以为你在指挥 AI其实你的肌肉在退化这一节是这篇文章最冷的地方。我犹豫过要不要写但我觉得必须写。Anthropic 今年 1 月有一篇论文。一项随机对照试验让程序员学一个新的编程库。结果——用 AI 辅助的那组成绩比纯手写的那组平均低了 17%。而且最依赖 AI、当甩手掌柜、用 AI 盲目试错的人成绩最低。论文给这种退化起了个名字叫认知卸载。意思是:程序员把理解、调试这些核心任务卸载给了 AI于是失去了通过报错、卡壳、摩擦来建设认知的机会。一句话——编程肌肉萎缩了。我读到这儿后背有点发凉。因为它揭示了一件比「失业」更隐蔽的事。我们一直担心的是「AI 替我做事我会不会丢了工作」。但这篇论文说的是另一回事AI 替你做事的同时正在悄悄改变你「用脑子」的方式。报道里新加坡的资深架构师丁洋说自己生成的代码量在大爆发但越来越「只想提要求不想亲自动手了」。还有程序员说得更伤感——「只想读代码、放弃写代码的自己不完整了」好像「有一部分自我已经流失了」。这就是认知卸载最隐蔽的地方它发生的时候你感觉是变强了。你产出更多、更快、更轻松。你以为你升级成了「指挥官」。但你可能不是指挥官。你可能是一个正在忘记怎么打仗的将军。我必须说句公道话——认知卸载不是 AI 的错是「怎么用」的错。同样这篇论文也说明那些不当甩手掌柜、坚持理解每一步的人受影响小得多。所以问题从来不是「用不用 AI」是「你在用 AI 的过程里到底还在不在思考」。这恰好印证了我一直讲的那句话AI 时代真正稀缺的不是产出能力是判断力。而判断力这块肌肉恰恰是最容易在「认知卸载」里悄悄萎缩的。但更让我坐不住的还不是这块萎缩的肌肉。是它背后一个更大的结构性问题——一个让我想起两百年前那场革命的历史类比。04 · 那一刀今天的程序员会不会是新的纺织女工先看一组数字我反复看了三遍。Greptile 的报告开发者月代码提交量过去一年增长了 76%。综合谷歌、Anthropic 等公司的数据AI 至少把开发者提交 PR 的平均时间缩短了 30%。效率确实涨了。但有一个细节常被忽略——省下来的时间最终还要「还回去」。科技公司往往比员工更早算好了「AI 时代的合理工作量」而这个新工作量远超以往。一句话AI 帮你省了 30% 的时间公司给你加了 76% 的活。这让我想起一个让我合上电脑想了很久的类比。19 世纪初的英国纺织业。珍妮纺纱机出现手工女工的效率提升了几十倍。但工厂主没有因此让工人少干、多拿——相反他们要求工人操作更多的机器、产出更多的纱线。最后纺织女工的工作强度不降反升。而她们的技能在机器的标准化操作里逐渐退化——从需要技艺的工匠变成了只需要重复动作的「机器附庸」。于是一个问题摆在面前今天的程序员会不会成为新的纺织女工这一刀砍在了我整个思考体系的命门上。因为我一直在讲一个核心观点AI 不是在提效是在造时间。一个程序员配上 Agent 矩阵等于凭空多出了几十个、上百个并行的「硅基分身」多出了过去不可能存在的时间。这个判断我至今相信。但纺织女工这个类比逼我补上一个我之前没正面回答的问题——AI 造出来的时间归谁如果硅基时间被造出来却全部被组织收走、变成更高的产出指标、更密的工作排期那程序员拿到的就不是自由是一条更长的鞭子。时间是多了但它不属于造它的人。这是「硅基时间」这个概念必须诚实面对的影面。造时间是真的。但谁拿走这些时间是另一场战争。还有一个被反复记录的吊诡大厂一边在招聘里疯狂要求 AI Coding 能力一边在内部对第三方 AI 工具设重重限制怕代码泄露。一边公关上高喊拥抱 AI一边一线员工说「从头到尾没接到过任何指令要加大 AI 使用」。这就和第 02 节那个细节对上了——刘昊们之所以敢疯狂烧 token是在薅公司内部自研助手的算力羊毛而一旦想用外面更强的第三方工具立刻撞上合规的墙。于是一线程序员被夹在中间公司既要你用 AI 卷出产能又怕你用 AI 漏了代码。内卷和合规在同一个人身上打架。公司展现的姿态像是在为「AI 替代程序员」做舆论准备。而真实的内部AI 还只是程序员的自发探索。最深的裂缝原来不在人和 AI 之间。在人和组织之间。写到这儿我想把节奏放慢一下。那天晚上我关掉电脑的时候想起一个画面。此刻的写字楼里应该还亮着不少灯。有人在让 Agent 跑一整夜的测试有人悄悄关掉了 AI、想找回自己写代码的手感有人盯着 token 余额睡不着觉怀疑自己是不是已经落后了。也还有很多人根本没意识到——时代已经换了一种走法。同一栋楼同一盏盏灯底下是完全不同的几种人生。焦虑、亢奋、抵触、茫然没有谁对谁错都只是被同一场地震晃到的普通人而已。我说这些是想在往下走之前提醒一句接下来的故事会更极端。但再极端的数字背后站着的也都是这样具体的人。那么那些看清了「时间被组织收走」这件事、决定不再当纺织女工、干脆自己跳出去的人后来怎么样了这是第三份材料的主角。05 · 军备竞赛一个人一个月940 万元 token第三份材料主角还是开头提过的「龙虾之父」Peter Steinberger绰号来自他那个爆火的 AI 编程项目 OpenClawclaw 是龙虾钳来自他自己在 X 上晒出的一张后台截图。那张截图上的数字离谱到我瞪大了眼睛——过去 30 天调用 OpenAI API 总费用130 万美元约合 940 万元人民币消耗6030 亿token发起760 万次请求每日请求量20.6 万次折算下来每秒调用 2.4 次有编程背景的人看到这个数字第一反应大概是「假的吧单人怎么烧得掉 130 万美元」。虾爹自己解释了——这不是拿来做什么大规模训练纯粹是他开了「快速模式」、让上百个 Codex 高频并发地跑推理为的是让这些 Agent 持续、激进地协作。他还补了一句关掉快速模式成本能立刻降 70%——也就是说这 940 万里有一大半是他主动为「快」付的溢价。这是一个人的账单。他的团队只有 3 个人。但他有庞大的硅基外援——同时在云端运行约 100 个 Codex。这些 Agent 自动 Review PR、扫安全漏洞、查重 Issue、写修复程序、监控 Benchmark甚至能监听会议内容然后自己创建 PR。最妙的是结构一些 Agent 负责干活另一些 Agent 负责盯着其它 Agent 干活。员工从人类逐渐变成了 AI Agent。这画风不就是一家真正的软件公司吗?面对「月烧 130 万美元」的质疑虾爹的回应特别能代表这个时代的逻辑。他说这压根不算贵——因为他不是拿 Codex 和「工具成本」比是拿它和「工程团队成本」比。我们替他把这笔账算一下你就懂这个逻辑有多狠。就算按他「关掉快速模式」的省钱版本算一个月也还要约 40 万美元。而在旧金山一个高级工程师 / 架构师的月薪大约 1.5 万美元。40 万除以 1.5 万——虾爹一个人一个月的 token 账单约等于传统时代一个带 25 到 30 人的工程师 Leader手下整支团队一个月的人力成本。一个人烧出一支团队。而且 token 还在变便宜团队却只会变贵。所以在他眼里这笔账不是「贵得离谱」是「便宜得离谱」——他用一个人的调度换来了过去要二三十个工程师才能干的活。OpenAI CEO 奥特曼Sam Altman说未来会是一个「extremely multi-agent」的世界。虾爹治下已经有那个味道了。这就是我们一直讲的那个判断的极端样本软件开发正在从「人类使用工具」变成「人类管理 Agent 团队」。一个 OPD调度一支硅基军团。但我想说的不是这个故事多励志。我想说的是它和前两份材料拼在一起露出了一个更冷的真相。Karpathy 焦虑「跟不上」。报道里那群人焦虑「被组织收割」。而虾爹这种最前沿的玩家,把焦虑变成了一场军备竞赛——谁的 Agent 多谁的 token 烧得狠谁就跑得快。还有一个关于卡帕西的细节他现在跑完 Codex 就切 Claude力争最大化各平台吞吐量一看到 token 额度有剩余就焦虑。这种情况在硅谷已成新常态——工程师把 token 使用率当成 KPI把「用不完额度」视为能力不足。过去焦虑是「我会不会被淘汰」。现在焦虑是「我的 token 烧得够不够狠」。焦虑没有消失。它只是从「怕落后」升级成了「停不下来」。读到这里前三份材料其实抛出了同一个问题Karpathy 怕跟不上一线的人怕被收割虾爹陷在停不下来的竞赛里——他们问的都是同一句话AI 时代一个程序员到底该怎么办?我一直没找到一个让我信服的答案。直到读到第四份材料。06 · 解药OpenAI 内部那个把焦虑劈开的词第四份材料是 OpenAI 一场内部分享的实录。讲的人是两位Romain Huet——OpenAI 开发者体验Developer Experience负责人之前在 Twitter 和 Stripe 做了多年开发者平台还有 Aaron Friel——OpenAI 技术团队的工程师正是他在 OpenAI DevDay 上演示了「让 Codex 跑七小时完成一个项目」。主题只有一个词——Vibe Engineering。先看一组让人坐直的数据OpenAI 内部工程师对自家 Codex 的采用率超过 92%所有内部 PR 都由 Codex 审核用 Codex 的工程师产出的合并 PR 比不用的人多 70%。但真正劈开我前面所有焦虑的是 Friel 讲的一句话——代码行数越来越便宜了。但证明代码有效这件事越来越贵了。我读到这句前面三份材料的雾一下散了。因为它精确地指出了AI 时代到底什么在贬值什么在升值。会写代码贬值能证明代码是对的升值。Karpathy 焦虑的「落后」本质就是没及时完成从前者到后者的转身。Romain 讲了一个故事把「证明代码有效越来越贵」这句话钉死了。几周前在伦敦他和一家公司的 CTO 并排坐着。他没有去说服对方「换我们的工具」只做了一件事打开 Codex 的代码审查功能挑了一个这家公司最近刚刚合并进生产环境的随机 PR让 Codex 看一眼。结果 Codex 当场揪出两个重大 bug——连他们最资深的工程师都漏掉了的 bug而他们正在生产环境里到处追这个 bug 的源头。代码是这些资深工程师写的。但「证明这段代码到底对不对」他们没做到Codex 做到了。Romain 说那一刻 CTO 的反应是:如果我不用这个东西我会落后。Friel 也讲了同一件事的内部版本——OpenAI 所有的 PR 现在都由 Codex 审真的拦下过一些会冲进生产环境的复杂 bug。这就是「信任越来越贵」最具体的样子当写代码变得几乎免费整个行业的重心正在从「谁能写出来」挪到「谁能证明它是对的」。Friel 现场演示了一个故事是这整套逻辑最好的注脚。他让 Codex 把一个 Kotlin 项目用 Rust 从零重写要求 100% 兼容。起点是一个空目录里面只有一个 prompt 文件。他把 prompt 贴进去然后——就等着。Codex 做的第一件事不是写代码。它先创建了一个叫「watchdog」的子代理专门负责提醒主代理「你的目标是什么、用户要的是什么」防止跑偏。然后它启动一堆子代理并行干活有的研究上游代码有的调研版本差异有的设计架构。所有进度都写进一个叫「exec plan」的文件——不只给模型看也给人看。这个任务工程师手写大概要几周。Codex 跑了一晚上大概 12 小时。还有一个更出名的版本Friel 有次在沙发上边看电视边把电脑设成不休眠让 Codex 跑一个任务。第二天醒来发现它还在跑——7 小时200 多轮迭代最后产出一个大约 500 行的 diff。很多工程师听到这个数字第一反应是「完了写了 10 万行垃圾吧?」但事实相反。这是一个非常复杂的改动而 Codex 把绝大部分时间花在了跑测试、改测试、再跑测试上。最后这个小小的 diff被 merge 了。我必须停下来点一句因为这正好接住了我在第 03 节抛出的那个冷数据——还记得吗Anthropic 那篇论文里AI 辅助组成绩低了 17%最依赖 AI、盲目试错的人成绩最低。那叫认知卸载。可 OpenAI 这个 7 小时 500 行的故事明明也是重度用 AI为什么结果相反?差别不在用不用 AI。差别在AI 跑得越多你是把「证明它对」的责任也卸载掉还是反而抓得更紧。低 17% 的那组是让 AI 随便写、然后祈祷测试能过。OpenAI 这组是 AI 写得越多人在「正确性」上投入越重——大部分算力花在测试和验证上。同样是重度用 AI一个在卸载认知一个在加固认知。这个区分有名字。Simon Willison——Web 框架 Django 的联合创始人、在开发者圈极有影响力的独立开发者和博主——提出了「Vibe Engineering」这个词专门用来跟「Vibe Coding」划清界限模式核心特征结局Vibe Coding让模型随便写然后祈祷测试能过甩手掌柜被替代——认知卸载肌肉萎缩Vibe Engineering对每一行代码负责但规划、架构、调试每个环节都重度调度 Agent被放大——成为 Director一句话压舱要用 AI 构建也要保持人类的责任。我看到这儿前面所有的裂缝、所有的分裂症瞬间归位了——焦虑的人大多在做 Vibe Coding。被放大的人都在做 Vibe Engineering。前面那个骂「屎山」的田明骂的是 Vibe Coding;狂热到睡 4 小时的周默也困在 Vibe Coding 的亢奋里。而 OpenAI 这套是把同一个 AI用成了完全不同的东西。那么 Vibe Engineering 时代什么变重要了?Romain 讲得毫不含糊他点了三样——设计与品味taste、判断力discernment、清晰的沟通。还有一样我特别认同产出让人类愿意读的东西。Friel 有个测试标准,我觉得可以刻在每个团队的墙上——如果 Codex 的产出是你自己都不想读的东西那它对下一个 AI 代理也不会有用。所以他们逼工程师多写文档、多写测试。理由不是老一套的「规范」而是:这些东西不只给人看是给下一个接手代码库的 AI 看的。这正是我一直讲的「底表化」——把判断和标准沉淀成 AI 能反复调用的东西。OpenAI 叫它「给 AI 看的文档」一回事。还有两个细节是「从写代码到调度 Agent」最硬的官方实证。一个是角色变了。Friel 开玩笑说现在工程师都成了 Manager——不自己写代码而是给 Codex 派任务、审产出。但 Codex 还会自己创建子代理、给子代理派活所以更准确地说——大家都成了 Director。另一个叫「Best of N」给 Codex 一个任务它并行尝试 4 种方案把 4 个结果都给你你挑最顺眼的再继续。Friel 有个我特别喜欢的说法——你其实是在用代码具身一套进化算法试很多、选赢家、带着赢家往前、再生新变体。而且就连那个 Kotlin 重写 Rust 的复杂任务单次成功率都超过 75%并行打几个再挑一个成功率高得惊人。这正是我反复讲的别问「怎么让 AI 帮我写这段」要问「怎么让几个 Agent 并行跑几条路、最后我挑一个」。前者是加法后者是乘法——OpenAI 把它做成了一个按钮。讲到这儿我必须回到第 03 节那个最扎心的恐惧——如果 AI 把代码都写了我的编程肌肉会不会萎缩?这场分享的最后一个观众提问问的正是这个工程师怎么才能不「手生」?Friel 的回答我觉得是整场分享里最该被程序员记住的一段。他给了三个具体做法——第一代码可以不写但必须读得懂。他说当代码变便宜「至少能读懂这段代码在干什么」反而变成了底线能力。他现在大部分时间花在读 AI 的输出、读懂、确认它对不对上。读不是退化。读是新的写。第二看到不懂的就追问到底。Codex 用了一个他不熟的技巧他不会划过去而是追问它「为什么这么做、底层到底在干什么」。他说这反而让他成了一个更敏锐more discerning的工程师——判断力不是在用 AI 中萎缩的是在「追问 AI」中练出来的。第三最生动的一个例子OpenAI 新上任的 HR 负责人 Joaquin主动退一步去当了四个月的实习生——就为了重新钻回写代码的一线把手感找回来。一个高管为了不脱离一线甘愿去做实习生。认知卸载不是 AI 时代的宿命。它是「只用不读、只要不问」的人的宿命。这正好回答了我在第 03 节没敢下结论的那个问题。退化是真的但它不是必然的。读代码、追问 why、不脱离一线——这就是在 Vibe Engineering 时代把肌肉留住的三个动作。所以,这场地震的解药其实就一句——别做 Vibe Coding 的赌徒去做 Vibe Engineering 的 Director。代码越来越便宜所以别再靠「写代码」证明自己——靠「证明代码有效」靠品味、判断力和让 AI 愿意读的表达。Hold Light and Shade · 这场地震的另一面Vibe Engineering 给了方向但我不想把这篇写成一支解药广告。所以我必须把光和影都摆出来否则就是另一种不诚实。光的一面是真的。Karpathy 说用对了这些新东西一个程序员能变强 10 倍。虾爹证明了一个人真的能调度上百个 Agent干出一家公司的活。能力的天花板被实实在在地顶高了。影的一面也是真的。那篇报道里有一个细节我觉得是整篇最清醒的一句。一位影视从业者说玩票的人只会无脑为新工具拍案叫绝而真正知道自己想要什么的人永远会感到不满足——但他们才是 AI 最核心的使用者是高质量内容的产出者。这句话翻译过来就是——AI 把「产出」变得极其便宜。于是「知道自己想要什么」变成了唯一的奢侈品。刘昊做了一堆东西后来回看「很多没什么价值也不像是自己想做的」。丁洋激动之余做出的东西「更像是突然被赋予某种能力后不得不发挥一通」。这是这场狂热里最安静、也最值得听的一个声音当放大变得免费没有方向的放大只是更快地制造噪音。光和影是同一件事的两面。门槛被砸平是光正因为人人可得它不再是护城河你唯一能守的退回到了「你到底想做什么、什么值得被做出来」——这是影也是这场地震对每个人最公平、也最严苛的考题。对你意味着什么分几种人对号入座。落点只有一个从 Vibe Coding 走到 Vibe Engineering。对一个正在狂热的程序员像刘昊、周默你跑得很快但停下来问一句——你做的这些东西有多少是「你真正想做的」有多少只是「AI 能做所以你就做了」把睡眠还给自己把方向感找回来。OpenAI 的人提醒过:进度单位不是代码行数是置信度。你是 Agent 的 Director不该是它们的瓶颈更不该是它们的附庸。对一个抵触 AI 的程序员像田明你对「屎山」和「认知卸载」的警惕是对的这份清醒很珍贵——你警惕的其实正是 Vibe Coding。但别把「警惕」变成「拒绝」。Vibe Engineering 就是为你这种人准备的:对每一行代码负责但在规划、架构、调试、文档每个环节都用上 Agent。你担心的退化是真的但躲开 AI 不能解决它把 AI 用成加固判断的工具才能。对一个普通工程师别被「跟不上」吓住。Karpathy 说得很清楚——过去 30 天没跟上的人观点就过时了但这也意味着这场竞赛每个月都在重新发牌没有人能靠老资历一直领先。最该练的不是手速是 OpenAI 点的那三样品味、判断力、把话说清楚。从今天起逼自己写「连下一个 AI 都愿意读」的文档和测试——这就是你的底表。对一个管理者 / CEO前面那个纺织女工的类比是给你看的。如果你只想用 AI 把员工的产出指标拉到 76% 的增长你会得到一批高效但麻木、最终技能退化的「机器附庸」以及一场你迟早要付代价的人才流失。真正该考核的不是谁的 token 烧得多是谁的产出置信度高。AI 造出来的时间怎么分配决定了你是在养 Director还是在造怨气。数字浓缩17%· AI 辅助组比纯手写组低的成绩——Vibe Coding 的代价940 万元· 一个人一个月烧掉的 token——焦虑变成军备竞赛76%· 用 Codex 的工程师多产出的合并 PR——Vibe Engineering 的红利7 小时 / 500 行· 大部分时间花在测试上——新的进度单位是置信度1 个词· Vibe Coding 还是 Vibe Engineering——被替代和被放大的分水岭我还没想清楚的事读完这四份材料有一件事我一直没想通摊出来跟你一起想。Vibe Engineering 是个好答案它解决了「怎么用 AI 才不会退化」。但它解决不了我在第 04 节抛出的那个问题——造时间和分时间是两回事。你可以是一个最自律、最讲究的 Vibe Engineering Director每一行代码都对它负责把品味和判断练到极致。但如果你头顶的组织只是把你这套本事换算成「那你一个月该交 76% 更多的 PR」那 Vibe Engineering 救得了你的代码质量救不了你的生活。它是一套关于「怎么把活干好」的方法论不是一套关于「时间归谁」的答案。Karpathy 的焦虑、一线的分裂、虾爹的军备竞赛本质上是同一件事——当 AI 把产能的上限彻底打开「人该工作到什么程度」这个问题第一次失去了天然的边界。过去边界是人的生理极限你一天只能写 8 小时代码。现在你可以指挥 100 个 Agent 7×24 小时跑。那么新的边界在哪里是公司的产出指标是同行烧 token 的速度还是一个人自己决定「我今天就到这儿」的能力?我担心的是,在一个产能没有上限的世界里如果一个人没有能力为自己设定边界那这个边界就会由别人来替他设——而别人设的边界永远比他自己设的更狠。这不是 AI 的问题也不是 Vibe Engineering 能解的题。说来讽刺——OpenAI 那场分享的开场白就是很多工程师都梦想有一个「永远不会累的同事」而 Codex 就坐在那个位置上。说这话的人是当一件大好事在说的。但前面那些睡 4 小时、发着抖的人提醒我们——一个永不疲倦的同事对一个会疲倦的人到底是解放还是逼问取决于谁说了算「今天到此为止」。写到最后我反而想把话收得简单一点。这篇从头到尾焦虑、分裂、军备竞赛、解药、影面绕了一大圈。但如果只留一句我想留的是——AI 可能永远不会累。但人会。所以未来真正稀缺的能力也许不是让 Agent 跑得更快、更久而是在一片「还能再跑一会儿」的轰鸣里有人能清醒地知道自己要去哪儿以及什么时候该关灯回家。会有一批程序员被这场焦虑吞掉。但那些既会用 Vibe Engineering 把活干好、又守得住方向、还舍得在该停时关灯的人会赢。毕竟未来的竞争从来不是人和 AI 比谁不知疲倦——而是看谁更清楚自己到底想用这些多出来的时间去换些什么。────────────────────//作者手记这一篇本来不在计划里。是连读 Karpathy 的帖子、一篇关于大厂程序员的报道、龙虾之父、再到 OpenAI 那场 Vibe Engineering 分享四份材料堆在一起实在坐不住临时写的。写的时候我对「认知卸载」和「纺织女工」这两段最舍不得也最犹豫。因为它们戳的是我自己这套「硅基时间」体系的软肋——我一直在讲造时间的红利却很少正面讲「这些时间归谁」。我决定把这个影面诚实地补上而不是绕过去。读到 Vibe Engineering 时我松了口气因为它给了焦虑一个出口但写到最后我又收住了——它能解代码的题解不了「时间归谁」的题。这两件事我都想说清楚。一个聪明的读者大概会问你前面几篇都在讲 AI 造时间的红利这篇却在讲焦虑和影面是不是打自己的脸我想说的是——红利和代价从来是同一枚硬币。只讲红利的人要么没看清要么在卖课。补一句关于材料的话。第四份材料我特意找到了一手出处——不是别人转述的二手稿是 OpenAI Forum 那场分享 Romain Huet、Aaron Friel、以及主持人 Chris NicholsonOpenAI 全球事务团队成员、活跃的 Codex 用户的逐字发言实录。伦敦那个 CTO 的两个 bug、75% 的成功率、Joaquin 去当四个月实习生这些最有力的细节都藏在一手实录里二手转述全删掉了。这也算是这篇文章自己的一个小注脚在一个信息被反复转述、压缩、再加工的时代回到一手本身就是一种判断力。本文引用的关键外部资料来源由最新一代 Claude 核心模型协助核查:Karpathy 言论及评论区Andrej Karpathykarpathy、Boris Cherny X 原帖认知卸载论文Anthropic 2026 年 1 月、屎山、纺织女工类比、Greptile 提交量与大厂态度等事实引自一篇关于大厂程序员的报道《程序员们的「AI 分裂症」》钛媒体龙虾之父 token 账单Peter SteinbergersteipeteX 原帖Vibe Engineering、7 小时 500 行、Best of N、75% 成功率、92%/70% 数据、伦敦 CTO、Joaquin 实习生OpenAI Forum 分享一手实录Romain Huet / Aaron Friel / Chris Nicholson 发言;「Vibe Engineering」一词由 Simon Willison 提出AI 能力增长数据Epoch AI Capabilities IndexECI下一期答问录回到 Token 经济——从 L1 算力底座到 L6 最终用户的五层生态。这场关于「时间归谁」的讨论我也想继续。欢迎在留言区接着聊。────────────────────《硅基时间》系列持续更新中。记录 AI 带来的时代趋势洞察与程序员行业的深层变迁。如果这篇对你有用欢迎扫码关注第一时间读到下一篇。AI 不是提效是造时间。扫码关注「硅基时间」——蒋涛 · CSDN推荐阅读硅基时间万字长文答问录一码盲消失OPD 崛起新市场在哪里Anthropic万亿美元估值背后真正的红利是什么