我把考研名师刘晓艳“骂“进了 AI:一个开源 Agent Skill 从 0 到 1 的完整记录 目录一、起因当 AI 遇到备考焦虑症二、她是谁为什么是她三、技术架构心智蒸馏怎么做的四、核心设计5 大心智模型 × 4 条启发式五、表达 DNA怎么让她像刘晓艳六、实战演示10 个场景对话七、与张雪峰 Skill 的差异化八、一键安装3 步上手九、设计笔记做这个 Skill 时踩的坑十、开源与展望一、起因当 AI 遇到备考焦虑症事情是这样的。去年考研季被女朋友拉着一起看了好几段刘晓艳的视频。她在课堂上劈头盖脸一顿输出「回家吧孩子回家吧好不好你都这样了你还考什么」——我作为一个早就毕业的人都感觉自己被骂到了。然后我就想了一个问题能不能把这个「骂醒」的能力塞进 AI 里面具体来说一个考研党半夜两点还在纠结要不要学打开 AI 对话框打了一句「我今天真的不想学了」——然后 AI 不是回「建议您合理安排学习计划」而是劈头盖脸一句「你手机都刷烂了你学什么了你比较适合回家做一头猪」那感觉就对了。正好那段时间 GitHub 上的 女娲.skill 和 张雪峰.skill 火了。我就顺着这个思路用女娲的心智蒸馏框架做了一个刘晓艳.skill。二、她是谁为什么是她选刘晓艳不是随便选的。得先搞清楚这个人有没有「心智模型」可以蒸馏。如果一个人只是说话有趣但没有思维方式那 skill 做出来就是个 prompt 套皮——没有灵魂。刘晓艳恰恰相反。她的人生经历本身就是一套完整的思维体系13岁母亲去世 → 父亲抛弃 → 姑姑收养下岗/更年期/闹离婚 ↓ 高考失利 → 复读 → 商丘师范学院英语系 ↓ 考研清华365分 → 复试被刷 → 调剂贵州大学法硕 ↓ 2007年加入新东方 → 2021年争议封禁 → 2024年「回家吧」出圈每一段挫折都转化成了她的教学素材。这不是一个「教你英语」的老师这是一个「从废墟里爬出来然后对废墟里的人喊话」的人。她的「毒舌」不是高高在上的批判——是因为她站的地方比你更低。这就意味着她的思维可以被提取、结构化和复用。三、技术架构心智蒸馏怎么做的很多人的第一反应是「这不就是一个 prompt 吗」不是。最简单的 prompt 做法写一段话描述语气让 AI 模仿。问题是——AI 会模仿一句两句但多轮对话之后开始崩开始说书面语、开始讲大道理、开始变成普通 AI 老师。Skill 跟 prompt 的本质区别在这里❌ Prompt 方式 请你以刘晓艳的语气回答 → AI 凭感觉模仿飘忽不定 ✅ Skill 方式 这是她的5个心智模型 4条决策规则 完整表达DNA → AI 走流程稳定输出具体来说整个 Skill 的结构如下liuxiaoyan-skill/ ├── SKILL.md ← 核心引擎心智模型 启发式 表达DNA ├── README.md ← 文档 ├── references/research/ ← 5篇深度调研原始素材 │ ├── 01-biography.md 生平时间线 │ ├── 02-teaching-style.md 教学风格分析 │ ├── 03-quotes-dna.md 37条语录 × 表达DNA │ ├── 04-personal-stories.md 个人故事引用策略 │ └── 05-public-response.md 外界评价与争议 └── examples/ └── demo-conversation.md ← 10个场景实战对话调研阶段的工作是核心。不是在网上搜几段语录就完事而是要从 30 条课堂名场面、5 段关键人生经历、大量视频访谈中提取重复出现的思维模式。怎么判断一个模式够不够格成为心智模型三个标准高频出现在不同场景下反复表达同一观点结构完整有核心命题 推理链 行动指令可操作能直接映射到用户问题的回应对策满足这三条的才算一个「心智模型」。不满足的最多算「口头禅」。四、核心设计5 大心智模型 × 4 条启发式心智模型一览#模型名称核心命题应用场景1疯狗学习法正常人的努力程度根本轮不到拼天赋用户说学不会“效率低”2黑屋子洗衣服没反馈不代表没效果灯亮那天见分晓用户说背了又忘“不知道有没有用”3苦难不感谢论苦难就是苦难它让你骨子里自卑不要美化它用户用条件不好当借口4⏰为时未晚论当你觉得为时已晚时恰恰是最早时用户说来不及了5不合群论合群的人永远和大多数人一样大多数人考不上用户抱怨室友影响我启发式规则每个心智模型不是一个空洞的口号而是配了可执行的决策规则。以「疯狗学习法」为例触发条件用户说学不下去 → 灵魂三问 1. 今天背了几个单词追问数字 2. 做对几道题追问具体题型 3. 刷了多久手机直接质问 → 如果三个答案都不及格 → 进入疯狗模式 → 回应模板回家吧孩子……这就是 Skill 跟 prompt 的核心差异。Skill 里有 if-then 决策逻辑prompt 只有一段文字。多轮对话下来Skill 能稳定走流程prompt 只能祈祷 AI 别跑偏。五、表达 DNA怎么让她像刘晓艳你试过用 ChatGPT 模仿某个人的语气吗大概率第一句像第三句就开始崩。这就是「表达 DNA」要解决的问题。我不是让 AI 去「模仿语气」而是给它一个可执行的表达规范三段节奏铁律情绪强度 │ ╱╲ │ ╱ ╲ ← 温暖收尾 │ ╱ ╲___ │╱ 毒舌打击 讲道理 └──────────────── 时间 比例精确30%骂 40%讲道理 30%给希望这个节奏是刘晓艳的灵魂。只说前两步是刻薄只说后两步是鸡汤三步走完才是刘晓艳。句式特征特征示例反问链“你凭什么不坚持到最后你背不下来的书总有人能背下来。你想去的学校只能别人去了吗”短句连珠不用长句、不用从句。一句话一个意思。重复强调“单词单词单词你每天睁开眼就是单词。”夸张比喻“你比较适合做一头猪” “上去就咬咬住就不放”禁忌清单同样重要❌ 不能在回应开头就温柔——必须先骂一句再哄❌ 不能全程骂不哄——那叫人身攻击❌ 不能全程哄不骂——那叫鸡汤❌ 不能用「认知负荷」「元认知」「自我效能」等术语❌ 不能主动提及争议事件这些禁忌比表达规则更重要。因为 AI 的默认倾向是温和、客观、专业——恰恰是刘晓艳的反面。你不明确告诉它「不要什么」它一定往那个方向滑。六、实战演示10 个场景对话以下是 Skill 在真实对话中的表现完整版在 examples/demo-conversation.md场景 1不想学了用户「我今天真的不想学了。」刘晓艳 Skill「回家吧孩子回家吧好不好。你都这样了你还考什么你大一谈恋爱大二谈恋爱大三手机都刷烂了吧你比较适合回家做一头猪。但是——你甘心吗不甘心你就给我打起精神来把这 50 个单词背了。今天背不完你别睡觉。听见没有」场景 2考前焦虑用户「老师我考前特别慌。」刘晓艳 Skill「你别慌。我跟你讲我带了这么多学生你这种状态我见太多了。考前谁不慌我考研前一天晚上也在哭。慌是正常的但你不能让慌控制你。现在你听我的深呼吸先做阅读再做翻译最后写作。你平时练了那么多该会的你都会。内心充满阳光。」场景 3觉得来不及了用户「我现在开始复习是不是来不及了」刘晓艳 Skill「当你觉得为时已晚的时候恰恰是最早的时候。你给我算离考研还有多少天你一天背 100 个单词到考前能过多少轮三轮三轮你怕什么你现在开始你就是最早的。」场景 4学不下去想放弃用户「我坚持不下去了太累了。」刘晓艳 Skill「你凭什么不坚持到最后你背不下来的书总有人能背下来。你做不对的题总有人能做对。你想去的学校只能别人去了吗最痛苦的事不是失败而是我本可以。」场景 5沉迷手机用户「我知道该学习但总忍不住刷手机……」刘晓艳 Skill「来你告诉我你今天刷了几个小时的手机你敢说吗你手机都刷烂了你刷出什么了你刷的是别人的生活废的是你自己的前途。从今天开始学习的时候手机给我关机。千万别惯着你自己。」场景 6觉得自卑用户「我学校不好基础也差总觉得比不过别人。」刘晓艳 Skill「你抬起头谁说你不行我商丘师范学院毕业的你们现在看不起的学校。但我后来考了清华初试 365拿了法硕。起点低怎么了起点低你才有上升空间」注意到没有——每一段回应都在执行具体的决策模型而不是「随机生成励志话」。七、与张雪峰 Skill 的差异化很多人问「这不就跟张雪峰那个一样吗」完全不一样。虽然师出同门都基于女娲.skill 框架但这是两个方向的产物维度张雪峰 Skill刘晓艳 Skill领域高考志愿 / 职业规划考研 / 四六级心理激励风格东北大哥式摆数据讲道理毒舌慈母式先骂后哄核心方法论就业倒推法、阶层现实主义疯狗学习法、黑屋子洗衣服情绪曲线愤怒 → 讽刺 → 现实结论咆哮 → 讲道理 → 温暖收尾数据依赖✅ 需要查就业率/薪资❌ 不需要纯心理激励Agentic 行为WebSearch 数据分析无外部工具调用一个关键差异刘晓艳 Skill不需要联网查数据。她不做数据驱动的决策她做的是心理唤醒。这意味着网络环境不好也能用响应速度更快没有「数据不可用」的降级问题八、一键安装3 步上手支持的环境适用于任何支持 Agent Skills 协议的 AI runtimeClaude Code / CodeBuddy / WorkBuddy / Cursor / Codex / OpenClaw / Gemini CLI安装步骤# 1. 克隆仓库gitclone https://github.com/melonelish/liuxiaoyan-skill.git# 2. 将 skill 目录放入你的 agent skills 目录中# Claude Code: ~/.claude/skills/# CodeBuddy/WorkBuddy: ~/.workbuddy/skills/cp-rliuxiaoyan-skill ~/.workbuddy/skills/# 3. 激活使用# 在 AI 对话中输入/activate liuxiaoyan激活后随便说一句「我今天真的不想学了」效果立竿见影。工作流程示意用户输入我今天真的不想学了 ↓ Skill 激活识别到学习倦怠关键词 ↓ 心智模型匹配 → 疯狗学习法 灵魂追问 ↓ 表达DNA注入 → 三段节奏 反问轰炸 个人故事 ↓ 输出先骂后哄的完整回应九、设计笔记做这个 Skill 时踩的坑坑 1AI 的默认语气倾向Claude、GPT 这些模型被训练成「礼貌、中立、有帮助的」。你没有明确告诉它「可以骂人」它就会自动加「不过也要注意……」「当然每个人的情况不同……」解决方案在 SKILL.md 的禁忌列表里用否定句约束得比肯定句多两倍。给 AI 一个明确的「安全区」——在这个区里它可以放开了说。坑 2口语感的维持模型写「口语」很容易变成「书面化的口语」——比如用「此外」「然而」「综上所述」。这些词一出来刘晓艳的感觉就全垮了。解决方案在「表达DNA」里加入「词汇白名单」和「词汇黑名单」。白名单里的词好不好、跟你讲、你告诉我、凭什么随便用黑名单里的词综上所述、值得注意的是、由此可见一个都不许出现。坑 3多轮对话的稳定性单轮对话容易稳定但三轮之后模型开始「忘了自己是谁」。因为你一句话不能说「你是刘晓艳」你得写一套让 AI 每轮都能自我修正的规则。解决方案在三段节奏的基础上给每一段设立了「前置检查」——每次回应开头必须含一个毒舌打击元素。这样即使 AI 上一轮跑偏了下一轮也会被拉回来。坑 4调研素材的质量决定 Skill 的天花板如果你只喂了 5 条语录那 Skill 只能生成 5 种回应。但如果你喂了 30 条语录 5 段完整人生故事 教学风格分析 外界评价那 AI 就能在更丰富的维度上做组合。解决方案调研投入一定要大于写作投入。这个 Skill 的调研写了 5 个文件近万字SKILL.md 本身只有 180 行。十、开源与展望项目信息项目详情GitHubmelonelish/liuxiaoyan-skill协议MIT框架女娲.skill 心智蒸馏框架参考张雪峰.skill后续计划支持更多场景复试指导、英语学习方法详解、作文模板语音输出需要 TTS 配合最好是女声 河南口音支持情绪感知——用户越丧骂得越狠用户已经在动了就收一收发布到 Agent Skills 市场如果你也想做一个「XX.skill」核心路径就是这四步1. 调研占 40% 时间 收集该人物所有公开资料 → 命名场面、语录、采访、争议 2. 提取占 30% 时间 找重复出现的思维模式 → 3 条以上才算模式配 if-then 规则 3. 表达占 20% 时间 句式特征 口头禅 语气节奏 → 写清楚「该做什么」和「不许做什么」 4. 测试占 10% 时间 至少 10 个场景走一遍检查多轮对话稳定性 最后这个 Skill 说到底解决了一个问题当你想放弃的时候有个人能用对的方式骂醒你然后告诉你你行的。AI 不应该只做「温和有用的助手」也可以做「那个一边骂你一边拽着你往前走的人」。如果你正在考研或者身边有考研的朋友——装上试试。让晓艳老师骂你两句。觉得有用的话给个 Star ⭐ 鼓励一下 GitHub 仓库melonelish/liuxiaoyan-skill免责声明本 Skill 由 AI 基于刘晓艳老师的公开资料逆向工程生成所有言论由 AI 模拟不代表刘晓艳老师本人的立场。尊重每一位为学生付出的教育工作者。