本文以公司组织架构为比喻深入浅出地解析了大模型、Agent、Prompt、Token、MCP、Skill、多智能体等AI核心概念。从大模型作为大脑的底层逻辑到Prompt作为沟通语言的技巧再到Agent的自主行动力以及MCP和Skill的标准化工具封装层层递进帮助读者构建清晰的AI技术图谱。最后对比Claude Code和OpenClaw等AI操作系统揭示多智能体协作的未来趋势为小白和程序员提供一份全面而实用的AI学习指南。大模型LLM—— 公司里最聪明的那个人先从最底层说起。大模型全称 Large Language Model大型语言模型是目前所有 AI 应用的大脑。它通过阅读互联网上几乎所有的公开文本——网页、书籍、论文、代码、论坛帖子——学会了理解和生成人类语言。你平时听到的名字本质上都是大模型产品名背后的大模型开发公司ChatGPTGPT-4 / GPT-5OpenAIClaudeClaude Sonnet / OpusAnthropicGeminiGemini Pro / UltraGoogle通义千问Qwen阿里巴巴DeepSeekDeepSeek-V3深度求索文心一言文心大模型百度豆包云雀大模型字节跳动大模型擅长什么理解语言、生成文字、推理问题、写代码、翻译、总结归纳。你问它问题它能回答你让它写代码它能写你让它翻译它能翻。但它有个致命短板它只能动嘴不能动手。它不能帮你发邮件不能帮你操作浏览器不能帮你跑代码、不能订外卖、不能发朋友圈。它就像一个被锁在房间里的天才顾问——你只能通过门缝跟它对话它没法走出来帮你干活。而且它还有失忆的问题——每次对话结束后它就忘了之前聊过什么除非你再次把上下文喂给它。这时候我们需要引入下一个概念。Prompt —— 你跟大模型说话的方式Prompt通俗说就是你给大模型的指令也有人叫它提示词。“帮我写一首关于春天的诗”——这是一个 Prompt。 “用 Python 写一个快速排序算法要求时间复杂度 O(n log n)”——这也是一个 Prompt。 “你是一个资深的健身教练请根据我的身高体重制定一份增肌计划”——这还是一个 Prompt。Prompt 写得好不好直接决定大模型给你什么质量的回答。举两个极端的例子差的 Prompt写篇文章大模型不知道你要写什么主题、什么风格、多长、给谁看只能给你一篇万能废话。好的 Prompt你是一个科技自媒体编辑擅长用大白话讲技术。请写一篇 1500 字左右的文章主题是为什么 2026 年 AI Agent 会爆发目标读者是不懂技术的普通用户。要求用具体案例说明不要堆术语结尾给出 3 个普通人可以用 AI Agent 做的事。这个 Prompt 明确了角色、主题、字数、风格、读者和结构要求大模型就能给你一篇质量高得多的文章。Prompt Engineering提示词工程就是研究怎么写出好 Prompt的学问。它有几个常用技巧角色设定告诉模型你是一个 XX 专家给出示例给它一两个参考样本让它照着写分步指引把复杂任务拆成步骤一步步引导约束条件明确字数、格式、风格、禁止事项简单记Prompt 就是你跟大模型的沟通语言说得好它就干得好。这是所有人都能学会的最基础的 AI 技能。Token —— 大模型的计费单位Token 是大模型处理文字的最小单位。它不是字也不是词而是介于两者之间的一种切分。具体规则有点复杂但你可以大致这样理解语言1 个 Token ≈中文0.5-1 个汉字英文0.75 个单词常见词 1 个 Token长词可能拆成 2-3 个代码差不多 4 个字符为什么你要关心这个两个原因第一大模型按 Token 收费。为什么不直接按字数或次数收费因为大模型内部不是按字来处理文本的它是按 Token 来理解和生成。同一个意思中文和英文消耗的 Token 数量不同所以用 Token 作为计费单位是最准确的——用了多少算力就收多少钱。你发一段 1000 字的 Prompt模型回复 2000 字这次对话大约消耗 3000-4000 个 Token。GPT-4 级别的模型每百万 Token 输入大约 $2-3输出约 $8-15。你可能注意到了输出比输入贵好几倍为什么这里涉及到一个关键的底层原理输入可以并行计算输出只能串行计算。输入你发给模型的文本是已知的模型可以同时处理所有 Token就像老师批改试卷——可以同时看很多份卷子。GPU 的并行计算能力在这种场景下能充分利用效率很高成本就低。输出模型生成的文本则完全不同。模型必须一个一个 Token 地预测——先预测第一个再基于第一个预测第二个再基于前两个预测第三个……每一步都依赖上一步的结果无法同时进行。就像排队买饭必须一个人买完才能轮到下一个。GPU 在这种串行模式下大量算力是闲置的利用率低所以成本就高。简单类比输入像看书一目十行并行处理输出像写书一个字一个字往外蹦串行生成。写作比阅读累多了对 AI 也是一样——而且写作还特别浪费 GPU 的算力。所以写 Prompt 有个技巧能精简就精简省 Token 就是省钱。第二每个模型有上下文窗口上限。上下文窗口Context Window就是模型能一次性看到的最大 Token 数。你可以把它理解为短时记忆容量。模型上下文窗口大约能容纳GPT-4o128K Token~6 万字中文Claude 3.5 Sonnet200K Token~10 万字中文Gemini 1.5 Pro1M Token~50 万字中文如果你的对话内容超过这个上限模型就会忘记最早聊的内容。这就是为什么有时候聊着聊着AI 就忘了前面说过的话。Agent —— 让大模型长出手和脚回到之前的问题大模型只能动嘴不能动手。Agent智能体就是解决这个问题的。Agent 大模型 行动力。怎么理解如果说大模型是一个只会坐在办公室里出主意的顾问那 Agent 就是这个顾问配了一台电脑、一个手机、一辆车——它可以上网搜索、可以操作软件、可以调用 API、可以执行代码、可以读写文件。Agent 和普通 AI 聊天的本质区别是自主决策对比维度普通聊天Agent交互方式你问一句它答一句你给个目标它自己规划步骤能否使用工具❌ 只能生成文字✅ 可以搜索、执行代码、调用 API多步任务需要你一步步指挥自己拆解任务、逐步执行出错处理等你纠正自己发现错误、尝试换方案举个例子。同样是帮我调研 OpenAI 和 Anthropic 的最新模型定价普通聊天模式 你得一步步来——先问 OpenAI 定价再问 Anthropic 定价最后让它做对比表。每一步都要你发指令。而且 AI 只能靠记忆回答数据可能已经过时了。Agent 模式 你只说一句话帮我调研两个模型的最新定价Agent 自己去搜索官网、提取数据、整理对比表、发现矛盾还会反复确认。五六步全自主完成。这就是 Agent 的价值你说做什么它自己决定怎么做。MCP —— 给 Agent 发工具的标准接口Agent 能干活了但它需要工具。搜索需要搜索引擎发邮件需要邮件 API操作文件需要文件系统查天气需要天气 API。问题来了每个工具的接入方式都不一样。A 工具用 REST APIB 工具用 GraphQLC 工具用 SDK……Agent 想用新工具就得专门写对接代码太麻烦了。MCPModel Context Protocol模型上下文协议就是来解决这个问题的。 你可以把它理解为AI 世界的 USB 接口。还记得 USB 出现之前的混乱吗键盘是 PS/2 圆口、打印机是并口、鼠标是串口、U 盘是……没有统一接口。每个设备都有自己的专属接口换个设备就得换个转接头。USB 统一了这些接口——一个口插什么都行键盘、鼠标、U 盘、打印机、摄像头统统一个标准。MCP 做的是一样的事。它定义了一套标准协议让任何工具只要按这个协议封装好称为 MCP ServerAgent 就能直接用——不需要为每个工具单独写代码。目前已经有的 MCP 工具包括MCP Server功能filesystem读写本地文件brave-search网络搜索github操作 GitHub 仓库postgres查询数据库google-maps地图和导航slack发送 Slack 消息MCP 由 AnthropicClaude 的公司在 2024 年底提出并开源目前已经被广泛采纳。越来越多的工具和平台在适配 MCP它正在成为 AI Agent 连接外部工具的事实标准。一句话理解MCP 让 Agent 从只会用几个固定工具变成能用任何工具就像 USB 让电脑从只有几个专属接口变成什么设备都能插。Skill —— Agent 的技能包MCP 给了 Agent 标准化的工具接口但光有工具还不够。给你一把锤子和一堆钉子你不一定能做出一个书架——你还需要一份详细的操作指南。Skill技能就是这份操作指南它是比 MCP 更高一层的封装。一个 Skill 里面包含的东西组成部分说明触发条件什么情况下该用这个技能比如用户要求写文章执行流程具体分几步、每步做什么使用工具哪些 MCP 工具会被用到输出格式最终结果应该长什么样注意事项哪些坑要避免打个比方大模型 一个聪明但什么工具都没有的人MCP 给这个人发了一套标准化的工具锤子、锯子、尺子Skill 一份如何从零搭建一个书架的完整教程有了 SkillAgent 不用每次都从零思考怎么完成任务。它只需要匹配到合适的 Skill然后按照 Skill 里定义的流程执行就行。在 OpenClaw 这样的平台上Skill 是最核心的概念。每个 Skill 就是一个预制好的能力模块article-writerSkill负责写公众号文章tweet-screenshot-to-docSkill负责截推文图video-script-creatorSkill负责写短视频脚本weatherSkill负责查天气Agent 接到任务后会根据任务内容自动选择合适的 Skill 来执行不需要你手动指定。总结一下到目前为止的层级关系大模型提供智力 → Agent 提供行动力 → MCP 提供标准化的工具接口 → Skill 提供打包好的完整技能。层层叠加缺一不可。Claude Code —— 从程序员工具进化成的 AI 操作系统Claude Code 是 Anthropic 推出的一款 AI 工具。它最早确实是一个专注于编程的 Agent——帮程序员写代码、修 Bug、跑测试。但随着发展它已经远远不止是编程工具了正在变成一个面向所有人的通用 AI 操作系统。它是怎么进化过来的第一代编程 AgentClaude Code 最初的设计目标很明确——做一个比 Copilot 更强的编程助手。它能理解整个项目、自主修改代码、运行测试、提交 Git。你可以把它理解为一个驻扎在你电脑里的程序员同事。第二代通用 Agent但很快大家发现Claude Code 的能力边界远不止编程。它能操作文件系统、搜索网页、读写文档、管理项目——本质上它是一个能操作你电脑的通用 Agent。你不需要会写代码也能用它来整理文件、分析数据、自动化日常任务。第三代多 Agent 协作平台现在 Claude Code 已经支持三种工作模式模式说明适合场景单 Agent一个 Agent 独立完成任务简单任务一个人就能搞定多 Agent多个 Agent 并行处理子任务复杂任务需要分工Agent Teams多个 Agent 组成团队协作大型项目需要紧密配合这意味着它不只是一个能干的员工了它更像是一个能组建和管理整个团队的项目管理系统。Claude Code vs OpenClaw什么关系说实话它们本质上做的事越来越像了。OpenClaw 之所以火核心原因是它最早打通了各种 IM 通道——微信、Discord、飞书、Telegram 都能接入还支持定时任务、记忆系统、Skill 体系。你可以把它理解为一个AI 管家帮你把 AI 能力分发到生活的方方面面。Claude Code 原本是给程序员用的但最近更新非常猛——也在快速支持多通道通信、定时任务、多 Agent 协作。Anthropic 明显在把它往通用 AI 平台的方向推。目前来看对比维度Claude CodeOpenClaw核心定位终端 AI 平台偏技术全平台 AI 调度系统偏运营擅长领域编程、项目开发、文件操作内容创作、自媒体、消息分发消息渠道正在快速扩展中微信、Discord、飞书等已成熟定时任务已支持已支持多 Agent单 Agent 多 Agent Teams单 Agent 多智能体工具生态MCP 协议Skill体系MCP 协议 Skill 体系目标用户开发者为主逐步破圈内容创作者、自媒体运营者我的判断这两个产品最终会演变成非常相似的东西——都是AI 操作系统。短期内 Claude Code 更受开发者欢迎OpenClaw 更受内容创作者青睐。但长远看Claude Code 背靠 Anthropic 的模型优势和资源投入我个人坚信它有可能一统天下——当然这只是个人观点AI 这个行业变化太快谁也说不准。普通人怎么用 Claude Code不需要会编程。举几个实际场景提示词参考帮我把 ~/Downloads 里所有的 PDF 文件按日期重命名并移动到 ~/Documents/归档/ 对应年月文件夹下。分析这个 CSV 文件告诉我哪个月销售额最高生成一张趋势图。帮我把这个 Markdown 文件转成 HTML套上这个 CSS 模板。Claude Code 本质上就是一个能操作你电脑的 Agent编程只是它最擅长的事之一。随着 AI 工具的发展写代码这件事会越来越像打字一样变成一个基础技能——而 Claude Code 就是帮你完成这件事的工具。OpenClaw —— 管理多个 Agent 的总指挥如果说 Agent 是一个个能干的员工Skill 是他们的技能培训MCP 是他们使用的标准工具那 OpenClaw 就是这个公司的操作系统——管人、管工具、管流程、管一切。OpenClaw 具体做了什么管理 Agent 的生命周期你可以同时运行多个 Agent——一个搜集信息一个写文章一个做图一个发布。OpenClaw 负责启动、监控、协调这些 Agent让它们各司其职、互不干扰。统一管理 Skill 库各种能力模块写文章、截图、发微博、查天气……都以 Skill 的形式存在 OpenClaw 里。Agent 需要什么能力就调用什么 Skill不需要重复开发。连接所有消息渠道微信公众号、Discord、飞书、Telegram、Slack……你不用分别登录各个平台。OpenClaw 统一对接所有渠道Agent 产出的内容可以直接分发到任何地方。记忆系统这是 OpenClaw 区别于普通 AI 工具的关键。它给 Agent 配了长期记忆——Agent 知道你之前聊过什么、你的偏好是什么、你的项目进展到哪了。下次对话不用从头解释它记得。定时任务Cron像闹钟一样定时触发任务。比如每天早上 7 点自动搜集 AI 资讯生成日报每天 8 点自动写公众号文章推到草稿箱完全不需要人工干预。安全管控Agent 拥有强大的行动力但也意味着风险。OpenClaw 提供了多层安全机制——危险操作需要审批、文件操作有沙箱保护、外部发送需要确认。确保 Agent 能干活但不乱来。打个比方总结概念公司类比大模型员工的大脑Agent会干活的员工MCP标准化的办公工具Skill员工的技能培训手册OpenClaw公司的管理系统OA HR 项目管理多智能体 —— 团队协作一个 Agent 能干很多事但有些任务太复杂、涉及领域太多一个 Agent 搞不定或者效率太低。多智能体Multi-Agent就是让多个 Agent 组成团队分工协作。举个真实的例子。在 OpenClaw 的实际使用中每天自动发一篇 AI 资讯文章到公众号背后是这样分工的Agent职责使用的 Skill️ 星哨情报员从 X/Twitter、新闻网站搜集 AI 资讯xingshao-scout✍️ 墨生编辑从情报中筛选选题撰写文章mosheng-writer 美工生成封面图和配图nano-banana-pro 镜言编导写视频口播脚本jingyan-script 主编审核、协调、最终确认article-writer 发布员推送到微信公众号草稿箱wechat-article-publisher每天早上 7 点星哨情报员自动开始工作搜集完情报后通知墨生编辑开始写文章同时美工准备配图写完后主编审核最后发布员推送到草稿箱。整个过程全自动不需要人工干预——除非主编审核发现问题才会通知臻哥来确认。多智能体的核心思想就是专业分工。就像公司里不可能让一个人同时做销售、设计、编程、财务一样每个 Agent 专注于自己最擅长的领域通过消息传递进行协作效率比一个全能 Agent高得多。大模型 员工的大脑智商很高但需要工具和方法Token 大脑的思考单位用多少收多少钱Prompt 你给员工下的指令说清楚才能干好Agent 能自己跑腿干活的员工不只是坐那动嘴MCP 标准化的工具接口就像 USB统一插拔Skill 完整的技能培训包不只是给工具还教怎么用Claude Code 从编程 Agent 进化为通用 AI 平台跟 OpenClaw 越来越像OpenClaw 公司的操作系统管理所有员工、工具、流程多智能体 团队协作多个专家组成项目组分工干活最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
小白必看!收藏这份大模型学习指南:从ChatGPT到多智能体,轻松入门AI新时代
发布时间:2026/5/29 1:22:03
本文以公司组织架构为比喻深入浅出地解析了大模型、Agent、Prompt、Token、MCP、Skill、多智能体等AI核心概念。从大模型作为大脑的底层逻辑到Prompt作为沟通语言的技巧再到Agent的自主行动力以及MCP和Skill的标准化工具封装层层递进帮助读者构建清晰的AI技术图谱。最后对比Claude Code和OpenClaw等AI操作系统揭示多智能体协作的未来趋势为小白和程序员提供一份全面而实用的AI学习指南。大模型LLM—— 公司里最聪明的那个人先从最底层说起。大模型全称 Large Language Model大型语言模型是目前所有 AI 应用的大脑。它通过阅读互联网上几乎所有的公开文本——网页、书籍、论文、代码、论坛帖子——学会了理解和生成人类语言。你平时听到的名字本质上都是大模型产品名背后的大模型开发公司ChatGPTGPT-4 / GPT-5OpenAIClaudeClaude Sonnet / OpusAnthropicGeminiGemini Pro / UltraGoogle通义千问Qwen阿里巴巴DeepSeekDeepSeek-V3深度求索文心一言文心大模型百度豆包云雀大模型字节跳动大模型擅长什么理解语言、生成文字、推理问题、写代码、翻译、总结归纳。你问它问题它能回答你让它写代码它能写你让它翻译它能翻。但它有个致命短板它只能动嘴不能动手。它不能帮你发邮件不能帮你操作浏览器不能帮你跑代码、不能订外卖、不能发朋友圈。它就像一个被锁在房间里的天才顾问——你只能通过门缝跟它对话它没法走出来帮你干活。而且它还有失忆的问题——每次对话结束后它就忘了之前聊过什么除非你再次把上下文喂给它。这时候我们需要引入下一个概念。Prompt —— 你跟大模型说话的方式Prompt通俗说就是你给大模型的指令也有人叫它提示词。“帮我写一首关于春天的诗”——这是一个 Prompt。 “用 Python 写一个快速排序算法要求时间复杂度 O(n log n)”——这也是一个 Prompt。 “你是一个资深的健身教练请根据我的身高体重制定一份增肌计划”——这还是一个 Prompt。Prompt 写得好不好直接决定大模型给你什么质量的回答。举两个极端的例子差的 Prompt写篇文章大模型不知道你要写什么主题、什么风格、多长、给谁看只能给你一篇万能废话。好的 Prompt你是一个科技自媒体编辑擅长用大白话讲技术。请写一篇 1500 字左右的文章主题是为什么 2026 年 AI Agent 会爆发目标读者是不懂技术的普通用户。要求用具体案例说明不要堆术语结尾给出 3 个普通人可以用 AI Agent 做的事。这个 Prompt 明确了角色、主题、字数、风格、读者和结构要求大模型就能给你一篇质量高得多的文章。Prompt Engineering提示词工程就是研究怎么写出好 Prompt的学问。它有几个常用技巧角色设定告诉模型你是一个 XX 专家给出示例给它一两个参考样本让它照着写分步指引把复杂任务拆成步骤一步步引导约束条件明确字数、格式、风格、禁止事项简单记Prompt 就是你跟大模型的沟通语言说得好它就干得好。这是所有人都能学会的最基础的 AI 技能。Token —— 大模型的计费单位Token 是大模型处理文字的最小单位。它不是字也不是词而是介于两者之间的一种切分。具体规则有点复杂但你可以大致这样理解语言1 个 Token ≈中文0.5-1 个汉字英文0.75 个单词常见词 1 个 Token长词可能拆成 2-3 个代码差不多 4 个字符为什么你要关心这个两个原因第一大模型按 Token 收费。为什么不直接按字数或次数收费因为大模型内部不是按字来处理文本的它是按 Token 来理解和生成。同一个意思中文和英文消耗的 Token 数量不同所以用 Token 作为计费单位是最准确的——用了多少算力就收多少钱。你发一段 1000 字的 Prompt模型回复 2000 字这次对话大约消耗 3000-4000 个 Token。GPT-4 级别的模型每百万 Token 输入大约 $2-3输出约 $8-15。你可能注意到了输出比输入贵好几倍为什么这里涉及到一个关键的底层原理输入可以并行计算输出只能串行计算。输入你发给模型的文本是已知的模型可以同时处理所有 Token就像老师批改试卷——可以同时看很多份卷子。GPU 的并行计算能力在这种场景下能充分利用效率很高成本就低。输出模型生成的文本则完全不同。模型必须一个一个 Token 地预测——先预测第一个再基于第一个预测第二个再基于前两个预测第三个……每一步都依赖上一步的结果无法同时进行。就像排队买饭必须一个人买完才能轮到下一个。GPU 在这种串行模式下大量算力是闲置的利用率低所以成本就高。简单类比输入像看书一目十行并行处理输出像写书一个字一个字往外蹦串行生成。写作比阅读累多了对 AI 也是一样——而且写作还特别浪费 GPU 的算力。所以写 Prompt 有个技巧能精简就精简省 Token 就是省钱。第二每个模型有上下文窗口上限。上下文窗口Context Window就是模型能一次性看到的最大 Token 数。你可以把它理解为短时记忆容量。模型上下文窗口大约能容纳GPT-4o128K Token~6 万字中文Claude 3.5 Sonnet200K Token~10 万字中文Gemini 1.5 Pro1M Token~50 万字中文如果你的对话内容超过这个上限模型就会忘记最早聊的内容。这就是为什么有时候聊着聊着AI 就忘了前面说过的话。Agent —— 让大模型长出手和脚回到之前的问题大模型只能动嘴不能动手。Agent智能体就是解决这个问题的。Agent 大模型 行动力。怎么理解如果说大模型是一个只会坐在办公室里出主意的顾问那 Agent 就是这个顾问配了一台电脑、一个手机、一辆车——它可以上网搜索、可以操作软件、可以调用 API、可以执行代码、可以读写文件。Agent 和普通 AI 聊天的本质区别是自主决策对比维度普通聊天Agent交互方式你问一句它答一句你给个目标它自己规划步骤能否使用工具❌ 只能生成文字✅ 可以搜索、执行代码、调用 API多步任务需要你一步步指挥自己拆解任务、逐步执行出错处理等你纠正自己发现错误、尝试换方案举个例子。同样是帮我调研 OpenAI 和 Anthropic 的最新模型定价普通聊天模式 你得一步步来——先问 OpenAI 定价再问 Anthropic 定价最后让它做对比表。每一步都要你发指令。而且 AI 只能靠记忆回答数据可能已经过时了。Agent 模式 你只说一句话帮我调研两个模型的最新定价Agent 自己去搜索官网、提取数据、整理对比表、发现矛盾还会反复确认。五六步全自主完成。这就是 Agent 的价值你说做什么它自己决定怎么做。MCP —— 给 Agent 发工具的标准接口Agent 能干活了但它需要工具。搜索需要搜索引擎发邮件需要邮件 API操作文件需要文件系统查天气需要天气 API。问题来了每个工具的接入方式都不一样。A 工具用 REST APIB 工具用 GraphQLC 工具用 SDK……Agent 想用新工具就得专门写对接代码太麻烦了。MCPModel Context Protocol模型上下文协议就是来解决这个问题的。 你可以把它理解为AI 世界的 USB 接口。还记得 USB 出现之前的混乱吗键盘是 PS/2 圆口、打印机是并口、鼠标是串口、U 盘是……没有统一接口。每个设备都有自己的专属接口换个设备就得换个转接头。USB 统一了这些接口——一个口插什么都行键盘、鼠标、U 盘、打印机、摄像头统统一个标准。MCP 做的是一样的事。它定义了一套标准协议让任何工具只要按这个协议封装好称为 MCP ServerAgent 就能直接用——不需要为每个工具单独写代码。目前已经有的 MCP 工具包括MCP Server功能filesystem读写本地文件brave-search网络搜索github操作 GitHub 仓库postgres查询数据库google-maps地图和导航slack发送 Slack 消息MCP 由 AnthropicClaude 的公司在 2024 年底提出并开源目前已经被广泛采纳。越来越多的工具和平台在适配 MCP它正在成为 AI Agent 连接外部工具的事实标准。一句话理解MCP 让 Agent 从只会用几个固定工具变成能用任何工具就像 USB 让电脑从只有几个专属接口变成什么设备都能插。Skill —— Agent 的技能包MCP 给了 Agent 标准化的工具接口但光有工具还不够。给你一把锤子和一堆钉子你不一定能做出一个书架——你还需要一份详细的操作指南。Skill技能就是这份操作指南它是比 MCP 更高一层的封装。一个 Skill 里面包含的东西组成部分说明触发条件什么情况下该用这个技能比如用户要求写文章执行流程具体分几步、每步做什么使用工具哪些 MCP 工具会被用到输出格式最终结果应该长什么样注意事项哪些坑要避免打个比方大模型 一个聪明但什么工具都没有的人MCP 给这个人发了一套标准化的工具锤子、锯子、尺子Skill 一份如何从零搭建一个书架的完整教程有了 SkillAgent 不用每次都从零思考怎么完成任务。它只需要匹配到合适的 Skill然后按照 Skill 里定义的流程执行就行。在 OpenClaw 这样的平台上Skill 是最核心的概念。每个 Skill 就是一个预制好的能力模块article-writerSkill负责写公众号文章tweet-screenshot-to-docSkill负责截推文图video-script-creatorSkill负责写短视频脚本weatherSkill负责查天气Agent 接到任务后会根据任务内容自动选择合适的 Skill 来执行不需要你手动指定。总结一下到目前为止的层级关系大模型提供智力 → Agent 提供行动力 → MCP 提供标准化的工具接口 → Skill 提供打包好的完整技能。层层叠加缺一不可。Claude Code —— 从程序员工具进化成的 AI 操作系统Claude Code 是 Anthropic 推出的一款 AI 工具。它最早确实是一个专注于编程的 Agent——帮程序员写代码、修 Bug、跑测试。但随着发展它已经远远不止是编程工具了正在变成一个面向所有人的通用 AI 操作系统。它是怎么进化过来的第一代编程 AgentClaude Code 最初的设计目标很明确——做一个比 Copilot 更强的编程助手。它能理解整个项目、自主修改代码、运行测试、提交 Git。你可以把它理解为一个驻扎在你电脑里的程序员同事。第二代通用 Agent但很快大家发现Claude Code 的能力边界远不止编程。它能操作文件系统、搜索网页、读写文档、管理项目——本质上它是一个能操作你电脑的通用 Agent。你不需要会写代码也能用它来整理文件、分析数据、自动化日常任务。第三代多 Agent 协作平台现在 Claude Code 已经支持三种工作模式模式说明适合场景单 Agent一个 Agent 独立完成任务简单任务一个人就能搞定多 Agent多个 Agent 并行处理子任务复杂任务需要分工Agent Teams多个 Agent 组成团队协作大型项目需要紧密配合这意味着它不只是一个能干的员工了它更像是一个能组建和管理整个团队的项目管理系统。Claude Code vs OpenClaw什么关系说实话它们本质上做的事越来越像了。OpenClaw 之所以火核心原因是它最早打通了各种 IM 通道——微信、Discord、飞书、Telegram 都能接入还支持定时任务、记忆系统、Skill 体系。你可以把它理解为一个AI 管家帮你把 AI 能力分发到生活的方方面面。Claude Code 原本是给程序员用的但最近更新非常猛——也在快速支持多通道通信、定时任务、多 Agent 协作。Anthropic 明显在把它往通用 AI 平台的方向推。目前来看对比维度Claude CodeOpenClaw核心定位终端 AI 平台偏技术全平台 AI 调度系统偏运营擅长领域编程、项目开发、文件操作内容创作、自媒体、消息分发消息渠道正在快速扩展中微信、Discord、飞书等已成熟定时任务已支持已支持多 Agent单 Agent 多 Agent Teams单 Agent 多智能体工具生态MCP 协议Skill体系MCP 协议 Skill 体系目标用户开发者为主逐步破圈内容创作者、自媒体运营者我的判断这两个产品最终会演变成非常相似的东西——都是AI 操作系统。短期内 Claude Code 更受开发者欢迎OpenClaw 更受内容创作者青睐。但长远看Claude Code 背靠 Anthropic 的模型优势和资源投入我个人坚信它有可能一统天下——当然这只是个人观点AI 这个行业变化太快谁也说不准。普通人怎么用 Claude Code不需要会编程。举几个实际场景提示词参考帮我把 ~/Downloads 里所有的 PDF 文件按日期重命名并移动到 ~/Documents/归档/ 对应年月文件夹下。分析这个 CSV 文件告诉我哪个月销售额最高生成一张趋势图。帮我把这个 Markdown 文件转成 HTML套上这个 CSS 模板。Claude Code 本质上就是一个能操作你电脑的 Agent编程只是它最擅长的事之一。随着 AI 工具的发展写代码这件事会越来越像打字一样变成一个基础技能——而 Claude Code 就是帮你完成这件事的工具。OpenClaw —— 管理多个 Agent 的总指挥如果说 Agent 是一个个能干的员工Skill 是他们的技能培训MCP 是他们使用的标准工具那 OpenClaw 就是这个公司的操作系统——管人、管工具、管流程、管一切。OpenClaw 具体做了什么管理 Agent 的生命周期你可以同时运行多个 Agent——一个搜集信息一个写文章一个做图一个发布。OpenClaw 负责启动、监控、协调这些 Agent让它们各司其职、互不干扰。统一管理 Skill 库各种能力模块写文章、截图、发微博、查天气……都以 Skill 的形式存在 OpenClaw 里。Agent 需要什么能力就调用什么 Skill不需要重复开发。连接所有消息渠道微信公众号、Discord、飞书、Telegram、Slack……你不用分别登录各个平台。OpenClaw 统一对接所有渠道Agent 产出的内容可以直接分发到任何地方。记忆系统这是 OpenClaw 区别于普通 AI 工具的关键。它给 Agent 配了长期记忆——Agent 知道你之前聊过什么、你的偏好是什么、你的项目进展到哪了。下次对话不用从头解释它记得。定时任务Cron像闹钟一样定时触发任务。比如每天早上 7 点自动搜集 AI 资讯生成日报每天 8 点自动写公众号文章推到草稿箱完全不需要人工干预。安全管控Agent 拥有强大的行动力但也意味着风险。OpenClaw 提供了多层安全机制——危险操作需要审批、文件操作有沙箱保护、外部发送需要确认。确保 Agent 能干活但不乱来。打个比方总结概念公司类比大模型员工的大脑Agent会干活的员工MCP标准化的办公工具Skill员工的技能培训手册OpenClaw公司的管理系统OA HR 项目管理多智能体 —— 团队协作一个 Agent 能干很多事但有些任务太复杂、涉及领域太多一个 Agent 搞不定或者效率太低。多智能体Multi-Agent就是让多个 Agent 组成团队分工协作。举个真实的例子。在 OpenClaw 的实际使用中每天自动发一篇 AI 资讯文章到公众号背后是这样分工的Agent职责使用的 Skill️ 星哨情报员从 X/Twitter、新闻网站搜集 AI 资讯xingshao-scout✍️ 墨生编辑从情报中筛选选题撰写文章mosheng-writer 美工生成封面图和配图nano-banana-pro 镜言编导写视频口播脚本jingyan-script 主编审核、协调、最终确认article-writer 发布员推送到微信公众号草稿箱wechat-article-publisher每天早上 7 点星哨情报员自动开始工作搜集完情报后通知墨生编辑开始写文章同时美工准备配图写完后主编审核最后发布员推送到草稿箱。整个过程全自动不需要人工干预——除非主编审核发现问题才会通知臻哥来确认。多智能体的核心思想就是专业分工。就像公司里不可能让一个人同时做销售、设计、编程、财务一样每个 Agent 专注于自己最擅长的领域通过消息传递进行协作效率比一个全能 Agent高得多。大模型 员工的大脑智商很高但需要工具和方法Token 大脑的思考单位用多少收多少钱Prompt 你给员工下的指令说清楚才能干好Agent 能自己跑腿干活的员工不只是坐那动嘴MCP 标准化的工具接口就像 USB统一插拔Skill 完整的技能培训包不只是给工具还教怎么用Claude Code 从编程 Agent 进化为通用 AI 平台跟 OpenClaw 越来越像OpenClaw 公司的操作系统管理所有员工、工具、流程多智能体 团队协作多个专家组成项目组分工干活最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】