AI名词科普 AI名词科普一、前言AI领域新词迭代速度极快本文将AI应用开发划分为三代工程化跃迁系统拆解主流专业名词、技术原理、应用场景及常见踩坑点梳理完整知识体系。二、核心总览AI三代工程化跃迁AI应用开发两年完成三代能力升级主线可概括为怎么问→喂什么→怎么验。世代核心能力代表名词核心作用第一代提示词工程Prompt、System Prompt、CoT、Few-shot、Zero-shot、JSON Mode教会AI听懂人类指令、规范输出结果第二代上下文工程RAG、Memory、Vector DB、Embedding、Function Calling、MCP、A2A、Skill、Agent、OpenClaw让AI调取外部资料、调用工具、自主完成任务第三代Harness质检工程Eval Harness、Benchmark、MMLU、HumanEval、GSM8K、A/B Test、Regression Test搭建评测体系验证AI输出可靠性三、底座层四大基础通用模块所有AI工程化技术均基于以下四大模块组合而成是理解各类名词的核心基础。模块通俗解释形象类比LLM大语言模型核心主体负责理解、推理、内容生成团队中负责思考决策的核心员工Memory记忆系统存储对话历史、知识库、运行状态档案柜/记事本留存各类信息Tools工具系统对接外部能力查数据、调用API、操作系统等电脑、电话连接外部世界Planning规划系统拆解复杂任务、规划执行流程与顺序项目经理/秘书制定待办流程模块组合解读完整AI系统需四大模块协同缺一难以落地。以AI员工为例LLM负责思考Memory记录信息Tools拓展外部能力Planning拆分复杂工作。四、第一代提示词工程Prompt Engineering1. 核心定位AI基础入门能力目标是规范AI输入指令控制输出格式与内容目前已是行业基础门槛。2. 核心名词详解Prompt提示词用户输入给AI的指令文本直接决定输出质量。System Prompt系统提示词后台隐藏配置定义AI角色、身份、行为规则全程生效。CoT思维链引导AI分步推理输出思考过程适用于数学、逻辑类难题。Few-shot少样本提示提供多组问题答案示例让AI模仿格式、风格作答。Zero-shot零样本提示无参考示例AI仅凭预训练知识直接回答仅适配简单问题。JSON Mode结构化输出强制AI以JSON格式返回内容便于程序自动解析。3. 阶段现状技术趋于成熟属于必备基础能力局限性明显无法读取企业内部数据、调用外部工具。五、第二代上下文工程Context Engineering1. 核心定位解决模型知识滞后、无法使用私有数据的问题核心是为AI补充精准外部信息与工具能力实现“开卷考试”。2. 核心名词详解RAG检索增强生成原理外挂知识库提问时先检索相关资料再将资料并入提示词生成答案。配套技术Embedding文本转向量、Vector DB向量数据库如Chroma、Milvus等存储并检索向量数据。Function Calling函数调用AI判断需外部数据时输出结构化指令调用API/工具获取结果后整合回复。MCP模型上下文协议Function Calling的标准化协议统一AI与各类工具数据库、文档、浏览器的对接接口实现即插即用。A2A智能体互联协议实现多个AI智能体之间通信、分发任务、同步状态支撑多AI协同工作。Skill技能预封装的任务逻辑包含指令与工具调用。区分标准集成工具、有规范输入输出为真Skill仅文本模板为假Skill。Agent智能体四大基础模块的完整组合体可自主规划、调用工具、完成复杂任务。演进路径工具聊天→单任务Agent→多Agent协作→通用自主Agent。OpenClaw开源Agent应用框架属于应用层封装降低Agent开发门槛。3. 阶段现状中高阶AI开发必备能力无此能力无法承接复杂企业级业务。六、第三代Harness质检工程1. 核心定位AI落地的关键环节解决AI可靠性验证问题区分业余开发者与专业团队是2026年行业主流趋势。2. 核心名词详解Eval Harness评测框架标准化自动化评测工具链模型、Prompt、RAG策略更新后一键批量测试。Benchmark基准测试行业通用测试题库用于初步筛选劣质模型仅作参考高分不代表业务适配。主流基准测试数据集MMLU覆盖57个学科的综合能力测试检验知识广度衍生版本MMLU-Pro、MMLU-R。HumanEval代码能力测试共164道编程题衍生HumanEval、MBPP、LiveCodeBench。GSM8K中小学数学推理题检验多步逻辑推理能力衍生GSM-Hard、MATH、AIME。A/B Test线上对照测试线上分流测试不同模型/策略关注用户满意度、任务完成率等真实业务指标。Regression Test回归测试维护标准测试题库每次迭代后复测避免新改动破坏原有可用功能。3. 阶段现状AI工业化落地分水岭不懂质检工程难以保障线上产品稳定。七、总结主线逻辑提示词怎么问→ 上下文喂什么→ 质检怎么验所有AI新词均可归入这三大类别。快速判断技巧遇到陌生名词判断其属于优化指令、补充信息工具、能力评测哪一类即可快速理解定位。行业趋势AI从“能对话”转向“能干活、可管控”标准化、自动化、可评测是核心发展方向。