AI 学习感想系列 · 全记录 第一篇Agent 的发展史从 ChatGPT 横空出世到公司立项 AI 项目 2023 年至今从文本补全到对话到上下文工程RAGMCP 再到提示词工程最后到 Agent伴随着 AI 的发展项目技术一直迭代以此记录 AI 的发展也巩固和结构化零散的知识体系。从文本补全开始这是最接近 Transformer 架构的请求方式直接将半截文本输入模型让他完善后半截这种写法一直到 2026 年初 Claude Sonnet 3.7 过期前在项目中都有使用是被火山业务员评价为不知所谓的错误调法可是一开始AI 中心的评测结果就是补全能力要强于对话能力不过是因为随着模型的发展对话能力反超补全逐步退出历史舞台以至于 Claude Sonnet 4.6 都不支持这一接口了。从 2024 年我正式接触 AI 服务器开始一系列专业名词逐步进入我的视野从 Gemini 模型向 Skylark 过渡的过程中从文本补全到对话接口的转变也使得上下文修改需求变得愈发强烈对此我引入 Dify 试图模拟代码逻辑将提示词的配置和效果审阅的工作开放给策划然而在实施过程中策划对于流程图的编排参数的调整Bug 调试的学习成本超出了我的预期显然这是一次不太成功的尝试后续只能使用 Streamlit 制作网页调用原生接口给策划调试然而提示词的更新与同步又伴生出一系列的问题磕磕绊绊最终两个不太完善的系统勉勉强强让策划接过了提示词调试的工作然而如何调如何评又成了问题。第二篇从评价体系到 Skill 误判书接上文当评价 AI 输出的需求摆在面前时我们第一时间写出来一套评分标准并尝试在 Dify 中让另一个 LLM 依照标准进行评分但是很遗憾由于其他工作的穿插此次尝试进行了一半我隐约感受到要使 AI 能够给出令人满意而且稳定的评分聊天记录传入的方式和评价体系描述的方式应当要进行系统的调整以此提示词工程开始进入我的视野上下文工程直接跳过了上面忘了提这应该是在引入 Dify 时的尝试RAGMCP 就是上下文工程的伴生物其目的就是为了节省模型上下文窗口将上下文的数据存储在其他地方按需获取。提示词工程伴随着大模型上下文窗口的增大还有所有人对大模型使用的熟练引导大模型的思考方向就成一个新的话题如同 DeepSeek 的思维链一般在模型上层告知模型按照 123 步执行以一个模型更容易接受的格式传递插入数据如何与整体相互结合印证提示词的尝试一直延展到如今Skill 就是兼顾上下文窗口和提示词的产物。提到 Skill第一次看到 Skill 的概念是 Anthropic 官宣在 Claude Code 中植入 Skill一番了解后我对 Skill 的评价是不过是上下文塞不下了拆开按需调用罢了不值一提。当时对大模型理解的不够深刻导致这一次的判断失误也使我的 Vibe Coding 时代到来的稍微晚了一点。毕竟此时我的重点全放在了全面接手 AI 服务器上。公司的 AI 服务器可以说是我的噩梦也是我内耗的开始从 2024 年年初开始公司流水下降业务收缩AI 中心裁员最后留下一根独苗带着他们写的 AI 服务器正式成为我们项目组的一份子我也因为负责游戏内 AI 表现这一块和其合作看到服务器代码时我是想不到作为一个人均 2w 的 AI 团队写出来的代码竟然毫无架构可言没有统一接口调用的系统没有重复逻辑的封装给我一种 AI 开发 API 调用的错觉也是我对 Skill 误判的由来。但是随着对 AI 了解的深入和对 AI 输入输出的探索还有对框架化代码的执念我通过结合自己的工程经验和对 Dify 的理解写出来 Pipeline Node 的框架封装了模型的调用层和 Prompt 的组合层使得模型的调用不再需要重头开始写 API 调用代码同时也将 AI 聊天由一堆重复代码变成了多个 Node 组装而成的 Pipeline也就是当下所说 Workflow当时不知道 LangChain 和 LangGraph 真的白绕这么大圈子。可是在我沉迷于 Pipeline 的自嗨时Agent 早已席卷世界Vibe Coding 成为主流。第三篇小龙虾、成本、幻觉与 Function Calling2026 年年初小龙虾的出现让 Agent 这一概念重新进入了我的视野与 Skill 误判相同的是出于工程人对 AI 的傲慢偏见小龙虾被归为了骗投资人钱骗用户 Token 的那一波但是其下隐藏的 AI 时代的工程架构又一次的被我忽略但是现在我对小龙虾依旧是这个定性他就如同我们当初进行的 Dify 测试一样对于圈外人学习和理解成本是不可接受的但是小龙虾的出现对于 AI 工程来讲是一个跨越式的节点他让更多的人关注到了 Agent也告诉了所有人AI 原来可以控制我电脑上的一切这是风险也是机遇。因为小龙虾的强势崛起我们公司也投入到了全面 AI 化的浪潮当中Claude Code 也因此成为了我代码的好伙伴对 AI 的理解由提示词开始向更深层的内容转变幻觉、格式限定、成本——我对这些内容感知越发明显。先说成本这是贯穿整个项目的一个议题从 2025 年开始随着国外 AI 大规模涨价和游戏流水下降成本优化便成为一个无法绕开的话题因此我们开始使用国内模型缩减上下文总结减少模型输出以此来减少 Token 调用的成本直到年中缓存价格的出现这一问题才得以缓解从此我们能够使用原来 1/5、1/10 的价格来获得更长的上下文当然更长上下文带来的却并不是效果的提升幻觉上下文冲突的问题随之而来。幻觉的产生根据 Transformer 的原理在上下文中未提及的内容甚至少量提及随着 AI 自身对 Token 关联度的计算和他本身的参数影响会出现一些原文中不存在的内容这在我们这种对话式的游戏中即是根本也是阻碍。根本在于我们要依靠这种机制来扩展对话的内容让玩家的聊天更具戏剧性和趣味性但是幻觉的突然产生会使玩家突然的出戏对此我们除了细化细节限定 AI 的输出范围外毫无办法总结下来是聊胜于无因为每一次框架的限定意味着对聊天可能性的扼杀在完善功能的同时我们也在一步步杀死我们的游戏同时 AI 工具向的发展也是一个因素这里按下不表后面再说。但是随机性的减少在 Vibe Coding 上却是一个重大利好可谓手段尽出。首先这归功于代码的可验证性ReAct Loop 的首要条件就是你能知道对错以此为基准展开反复尝试对于聊天结果打标让 AI 基于此去进行扩展尝试的不确定性而言让 AI 重新编译代码然后执行测试用例显得格外简单而一系列的代码操作便引出了上面说过的格式化输出。从 AI 时代开始格式化输出就是一个重大议题从在提示词中限定格式到模型内置 JSON ObjectJSON Schema再到 Tools 的核心 Function Calling时至今日我对所有 AI 学习者的建议就是搞懂 Function Calling然后学习系统架构即可。第四篇编排→控制→Skill 与 Teams今年之前我对 AI 的理解来源于项目的 AI 服务器的调优总结为两个字编排我需要控制数据的流动并验证数据的结果这是基于传统软件工程面向确定工作流的结果而今年我对 AI 的理解则是来自 OpenClawHermessClaude Code 这一类 Agent 自动化工具总结为俩字控制其实没有必要强行区分 Workflow 和 Agent 的区别毕竟 Agent 要得出一个确认的结果也是要有一套工作流的而这一套工作流往往就会被固定成 Skill这也就是 Skill 的第一个功能代替记忆成为 AI 工作新的基石听说 Hermess 比 OpenClaw 多出来一个记忆总结功能无非就是结束聊天总结为记忆或者 Skill 罢了可能我又犯了傲慢偏见的老毛病但是毕竟人的精力是有限的同样的框架也没必要看太多了。除了固定工作流程外Skill 还有一个功能拆分提示词这也是在 Vibe Coding 的过程中发现的一个问题如果服务端和客户端的文件编码格式不一样怎么办最好的方式不是反复在提示词中强调而是使用两套不同的提示词用两个 Agent 隔离开保证二者上下文互无干扰这也算一种 Multi-Agent 吧Claude Code 称之为 TeamsTeams 刚出时我同样对其简单的架构嗤之以鼻但是单论问题的解决方案设计思路来讲他确实可以单开一页误判有点多。第五篇小结从接触 AI 开始我都是先认知再认字一步一摸索对于后续 AI 服务器的修改应该是 Agent 社区化首先逐步将 Workflow 修改为一个能感知游戏服务端的 Agent这需要在游戏服务端开辟多个信息请求接口AI 服务器的请求流程也要发生大的改动显然以现在的工时分配和资源投入这只能是一个计划对于整个 AI 行业的发展只能说随着 AI 工具向的发展进程AI 聊天会越发无趣毕竟一个只会说好的应声虫不会获得多数人的掌声当然也不排除 AI 在某一阶段发生质变真正能够理解情绪回应情绪在工程化阶段本年度有两大节点一个就是 OpenClaw 的发布他申明了 AI 应该是什么样他不是第一个但因为他一个能干活有记忆的 Agent 才被大家所熟知他有推广之功还有一个就是 DeepSeek 缓存降价这是开局之功无论 ClaudeOpenAIGemini 被吹的天花乱坠我认为在 DeepSeek 降价前的 AI 项目都是无根之木无源之水因为永远都有一个成本问题横亘在使用者眼前DeepSeek 的出现使的使用成本从工程大头变为了添头更多参与者能在这波浪潮里去尝试真正将 AI 从试验性项目转变为实践。在这个节点写这个大纲一是记录过去的尝试二也是通过回忆去夯实以前的知识为日后的努力寻找方向Agent 工程不是独立于软件工程的存在他应该作为软件工程的一部分融入到项目乃至操作系统中如今是 API等到小模型性能满足说不定可以内置到软件里新时代的软件应当逐步从接受明确指令到处理模糊任务。以此记录我的 AI 工作。