AI开发基础（第8篇）：Prompt与Context Engineering

发布时间：2026/5/23 2:12:11

AI 开发基础第8篇Prompt Engineering 与 Context Engineering - 与模型沟通的艺术适合读者已读完第7篇Multi-Agent想深入理解如何有效控制模型输出预计阅读时间35分钟前言为什么前面7篇都绕不开提示词回顾一下前7篇里我们已经用到了大量提示词第3篇Agent Loopsystem prompt定义Agent行为第4篇Reasoning请一步步思考触发CoT第6篇Memory把用户画像注入prompt第7篇Multi-Agent每个Agent有不同的system prompt提示词是你和LLM之间唯一的沟通方式。写不好提示词模型再强也发挥不出来。但提示词工程这个词现在有个更大的进化Context Engineering上下文工程。一、Prompt Engineering让模型听懂你1.1 提示词的三个层次层次说明例子指令直接告诉模型做什么“翻译成英文”上下文提供背景信息帮助理解“这是一份法律合同请翻译”示例给出期望的输入输出格式“输入你好 → 输出Hello”好的提示词清晰的指令充足的上下文典型的示例1.2 结构化提示词模板defbuild_prompt(task:str,context:str,examples:listNone,constraints:listNone):构建结构化提示词parts[]# 指令parts.append(f## 任务\n{task})# 上下文ifcontext:parts.append(f## 背景\n{context})# 示例ifexamples:parts.append(## 示例)fori,exinenumerate(examples,1):parts.append(f### 示例{i}\n输入{ex[input]}\n输出{ex[output]})# 约束ifconstraints:parts.append(## 约束)forcinconstraints:parts.append(f-{c})return\n\n.join(parts)# 使用promptbuild_prompt(task将中文技术文章摘要翻译成英文保持专业术语准确。,context目标读者是国际开发者文章关于AI Agent开发。,examples[{input:本文介绍了Agent Loop的核心概念,output:This article introduces the core concepts of Agent Loop},],constraints[专业术语保留英文如 Agent、RAG、MCP,不要意译忠实原文,输出格式为纯文本不加额外说明,],)1.3 高频提示词技巧技巧1角色设定你是一个有10年经验的Python高级工程师。你写的代码 - 遵循PEP 8规范 - 有类型注解 - 有docstring - 处理边界情况为什么有效LLM训练数据中有大量高级工程师写的代码和初级工程师写的代码。角色设定帮你锁定高级那一部分。技巧2输出格式控制请按以下JSON格式输出 { analysis: 分析结论, confidence: 0.0-1.0的置信度, suggestions: [建议1, 建议2] }踩坑有时候LLM不严格按格式输出。加一句只输出JSON不要其他内容可以改善。更可靠的方案是用Structured Output第1篇提过的Function Calling方式。技巧3Few-Shot示例## 分类任务示例1 输入今天天气真好心情不错输出{sentiment: positive, category: 日常} 示例2 这个Bug我已经改了3遍了还是不对输出{sentiment: negative, category: 工作} 现在请分类输入新的AI模型发布了比上一代快3倍输出经验3个示例通常就够了。太少1个模型可能过拟合那个模式太多10个浪费Token。技巧4负向提示不要 - 不要用Markdown标题 - 不要添加这里是翻译结果之类的说明 - 不要省略原文中的数字和日期必须 - 必须保持原文的段落结构 - 必须保留所有超链接经验负向提示比正向提示更有效。模型知道不该做什么后犯错率明显降低。二、Context Engineering管理模型的全部输入2.1 Prompt Engineering → Context Engineering传统Prompt Engineering关注的是你写的那段文字。但模型的输入远不止你写的提示词模型的完整输入Context System Prompt ← 你定义的Agent角色和行为对话历史 ← 之前的多轮对话工具定义 ← Function Calling的工具schema RAG检索结果 ← 向量数据库检索的知识用户画像 ← 之前存储的用户偏好代码上下文 ← 如果在做代码相关任务任务状态 ← Multi-Agent的共享状态 ContextContext Engineering 管理这所有输入的工程。不只是写好提示词而是确保整个上下文都是高质量、相关的。2.2 上下文窗口的预算管理假设模型有128K Token的上下文窗口你怎么分配组成部分建议分配说明System Prompt~2K角色定义行为规则够用就行工具定义~5-15K取决于工具数量和schema大小用户画像~1K偏好摘要RAG检索结果~5-10K最相关的3-5段对话历史剩余空间越多越好但需要裁剪用户输入~1K当前问题输出预留~4K给模型留足回答空间代码实现classContextManager:上下文管理器def__init__(self,max_context_tokens:int120000):self.max_tokensmax_context_tokens self.reserved{system:2000,tools:0,# 动态计算profile:1000,rag:8000,input:1000,output:4000,}defcalculate_budgets(self,tool_schemas:list,rag_results:list,history:list,profile:dict)-dict:计算各部分的Token预算importtiktoken enctiktoken.encoding_for_model(gpt-4o-mini)# 动态计算工具定义的大小tool_tokenssum(len(enc.encode(json.dumps(t)))fortintool_schemas)self.reserved[tools]tool_tokens# 已固定占用fixedsum(self.reserved.values())-self.reserved[tools]available_for_historyself.max_tokens-fixed-tool_tokens-self.reserved[rag]return{system:self.reserved[system],tools:tool_tokens,profile:self.reserved[profile],rag:self.reserved[rag],history:max(0,available_for_history),input:self.reserved[input],output:self.reserved[output],}defbuild_context(self,system_prompt:str,tool_schemas:list,rag_results:list,history:list,profile:dict,user_input:str)-list:构建完整的上下文budgetsself.calculate_budgets(tool_schemas,rag_results,history,profile)messages[]# System Promptmessages.append({role:system,content:system_prompt})# 用户画像注入到system promptifprofile:messages[-1][content]f\n\n用户信息{json.dumps(profile,ensure_asciiFalse)}# 对话历史按预算裁剪trimmed_historyself._trim_to_budget(history,budgets[history])messages.extend(trimmed_history)# RAG结果ifrag_results:rag_text参考信息\n\n.join(rag_results)messages.append({role:user,content:rag_text})messages.append({role:assistant,content:好的我已阅读参考信息。})# 用户输入messages.append({role:user,content:user_input})returnmessagesdef_trim_to_budget(self,messages:list,max_tokens:int)-list:裁剪消息到预算范围内importtiktoken enctiktoken.encoding_for_model(gpt-4o-mini)kept[]total0formsginreversed(messages):tokenslen(enc.encode(msg[content]))iftotaltokensmax_tokens:breakkept.insert(0,msg)totaltokensreturnkept2.3 动态上下文高级用法根据用户输入动态决定需要什么上下文。asyncdefdynamic_context(user_input:str,user_id:str)-list:动态构建上下文# 第1步用一个小模型快速分析判断需要哪些上下文analysisawaitsmall_model_call(f分析用户输入判断需要哪些上下文多选 - history: 对话历史 - profile: 用户画像 - rag: 知识库检索 - tools: 工具调用用户输入{user_input}只输出需要的上下文名称逗号分隔。)needed[x.strip()forxinanalysis.content.split(,)]messages[{role:system,content:你是一个智能助手。}]ifprofileinneeded:profileget_user_profile(user_id)ifprofile:messages[-1][content]f\n用户画像{json.dumps(profile)}ifhistoryinneeded:messages.extend(get_recent_history(user_id,n10))ifraginneeded:resultsawaitknowledge_search(user_input,top_k3)ifresults:messages.append({role:user,content:f参考资料\n\n.join(results)})messages.append({role:assistant,content:已阅读参考资料。})messages.append({role:user,content:user_input})returnmessages好处不是每次都塞满所有上下文。简单问题少塞复杂问题多塞Token利用率更高。三、提示词工程 vs 上下文工程的区别Prompt EngineeringContext Engineering关注点你写的提示词文本模型的全部输入范围system prompt 用户消息prompt history tools RAG profile …目标让模型理解你的意图让模型在最优上下文中工作技术角色设定、Few-Shot、CoTToken预算管理、动态裁剪、RAG检索、记忆注入类比写好一篇演讲稿准备好演讲的全部环境灯光、音响、观众背景Context Engineering是Prompt Engineering的升级版。它告诉你不只是写好提示词而是管理好模型能看到的所有信息。四、真实项目经验4.1 CSDN文章生成的上下文管理asyncdefarticle_context(topic:str)-list:文章生成的上下文构建messages[{role:system,content:你是一个技术文章写作专家。写作规范 - 代码必须完整可运行 - 数据必须有来源 - 有真实踩坑经验 - 面向中级开发者 - 3000-5000字}]# 检索相关文章作为风格参考relatedawaitsearch_my_articles(topic,top_k2)ifrelated:ref_text你的历史文章风格参考\nforarticleinrelated:ref_textf-{article[title]}\nmessages.append({role:user,content:ref_text})messages.append({role:assistant,content:好的我会参考这些文章的风格。})# 搜索竞品文章了解别人怎么写的competitorsawaitsearch_web(topic,top_k3)ifcompetitors:comp_text竞品文章概要\nforcincompetitors:comp_textf-{c[title]}:{c[summary]}\nmessages.append({role:user,content:comp_text})messages.append({role:assistant,content:好的我会参考但保持原创。})messages.append({role:user,content:f请写一篇关于{topic}})returnmessages4.2 提示词版本管理生产环境必须做的prompts/ ├── v1/ │ ├── agent_system.txt │ ├── coder_system.txt │ └── reviewer_system.txt ├── v2/ │ ├── agent_system.txt │ ├── coder_system.txt │ └── reviewer_system.txt └── CHANGELOG.md # 记录每次改了什么、为什么改importhashlibdefprompt_hash(prompt:str)-str:计算提示词hash用于追踪版本returnhashlib.md5(prompt.encode()).hexdigest()[:8]# 每次LLM调用记录使用的提示词版本log_entry{prompt_hash:prompt_hash(system_prompt),prompt_version:v2,input:user_input,output:response.content,tokens:response.usage.total_tokens,timestamp:2026-05-22T08:00:00Z,}踩坑改了提示词后效果变差但忘了改了什么。版本管理hash追踪可以避免这个问题。五、本章总结你学到了什么Prompt Engineering四技巧角色设定、输出格式控制、Few-Shot示例、负向提示Context Engineering不只是写好提示词而是管理模型的所有输入Token预算管理按优先级分配上下文窗口空间动态上下文根据输入判断需要哪些上下文不浪费Token提示词版本管理生产环境必须追踪提示词变更关键公式Context System Prompt History Tools RAG Profile Input Context Engineering Token预算分配动态裁剪相关性检索下一篇预告第9篇Harness Engineering 与知识地图 - 管控整个Agent系统参考资料OpenAI Prompt Guidehttps://platform.openai.com/docs/guides/prompt-engineeringAnthropic Prompt Guidehttps://docs.anthropic.com/en/docs/build-with-claude/prompt-engineeringPrompt Patterns论文https://arxiv.org/abs/2102.07484Context Engineering综述https://www.anthropic.com/research/building-effective-agents上一篇第7篇 Subagent 与 Multi-Agent下一篇第9篇 Harness Engineering 与知识地图

写给新手的 release-management：昇腾版本管理到底是啥？

之前帮兄弟搞版本发布，他问我：“哥，CANN 的版本是怎么管理的？我想找 8.0 的 Release Notes，在哪看？” 我说看 release-management 仓库。好问题。今天一次说清楚。 release-management 是啥？ r…

2026/5/23 2:11:50 阅读更多

写给新手 cann-recipes-spatial-intelligence：昇腾空间智能最佳实践到底是啥？

之前帮兄弟搞 3D 视觉项目，他问我：“哥，昇腾上有没有空间智能的最佳实践？我自己在那调 PointNet，性能惨不忍睹。” 我说有，cann-recipes-spatial-intelligence。好问题。今天一次说清楚。 cann-recipes-sp…

2026/5/23 2:11:50 阅读更多

量子生成模型与高斯玻色采样的融合创新

1. 量子生成模型与高斯玻色采样的融合创新量子机器学习领域近年来涌现出一个关键问题：如何在保持量子优势潜力的同时，解决量子模型的训练难题？传统量子电路面临梯度估计困难、优化路径平坦化等挑战，而高斯玻色玻恩机（G…

2026/5/23 2:11:30 阅读更多

不只是烧录：用Jetson Orin Nano + OpenCV 4.4.0 + ROS Noetic搭建你的第一个边缘视觉AI项目

从零构建边缘视觉AI流水线：Jetson Orin Nano OpenCV 4.4.0 ROS Noetic实战指南当一块信用卡大小的开发板能够实时处理4K视频流时，边缘计算的时代才真正到来。Jetson Orin Nano凭借其Ampere架构GPU和6核Arm Cortex-A78AE CPU，在10瓦功耗下实…

2026/5/23 3:00:18 阅读更多

告别开发依赖！SAP顾问必学的SQ01/SQ02/SQ03实战：5步搞定自定义报表

SAP顾问自助报表实战：5步掌握SQ01/SQ02/SQ03核心技巧当销售总监在周一晨会上突然要求查看按区域划分的订单滞留分析时，作为SAP业务顾问的你能否在下午茶时间前交付这份临时报表？传统ABAP开发流程的漫长等待周期早已无法匹配现代业务的敏捷需…

2026/5/23 3:00:18 阅读更多

DocKit v1.0 发布 — AI 原生 NoSQL 桌面客户端，支持 Elasticsearch、OpenSearch 和 DynamoDB，本地优先，Apache 2.0 开源

🏡 微信公众号：GEEKFUN 原文发布于：https://www.geekfun.club/zh/blog/introducing-dockit-v1 开源社区-GEEKFUN：https://www.geekfun.club/zh/ ⛳️ 欢迎关注 🐳 点赞 🎒 收藏 ✏️ 留言文章发布于公众号…

2026/5/23 2:59:37 阅读更多

21.jdbc 学习笔记：从原理到实践的全流程梳理

目录 1. 数据库客户端-服务器结构与设计阶段 2. API（应用程序编程接口）的概念 3. 数据库多样性与 JDBC 的诞生驱动程序的“生态”差异： 4. 驱动程序的获取途径编辑编辑编辑 5. 手动下载 vs Maven 导入（以 MySQL…

2026/5/23 2:59:37 阅读更多

DSP28337D的ePWM保护机制：Trip-Zone模块的三种触发方式与实战配置（附代码）

DSP28337D的ePWM保护机制：Trip-Zone模块的三种触发方式与实战配置（附代码） 在电机控制和电力电子系统中，硬件保护电路的设计往往决定了整个系统的可靠性上限。当MOSFET遭遇直通电流、IGBT面临过压威胁时，软件层面的保护…

2026/5/23 2:59:37 阅读更多

Ubuntu 20.04离线安装ntpdate保姆级教程（附arm64/amd64包下载与依赖解决）

Ubuntu 20.04离线安装ntpdate全架构实战指南在封闭网络环境中部署时间同步服务是许多企业运维和开发者面临的现实挑战。当服务器无法连接互联网，特别是当这些服务器采用非x86架构（如国产化ARM平台）时，获取正确的软件包并解决依赖…

2026/5/23 2:59:37 阅读更多

红黑树完全指南：从五条性质到完整插入删除实现

引言在前面的树系列中，我们学习了二叉搜索树（BST）和 AVL 树。AVL 树通过严格的平衡条件（|BF| ≤ 1）保证 O(log n) 的性能，但代价是删除操作可能触发 O(log n) 次旋转。红黑树（Red-Black Tree&am…

2026/5/23 0:01:37 阅读更多

黎曼猜想：哲学 × 数学思维范式全链条

黎曼猜想：哲学数学思维范式全链条华夏之光永存｜七大数学猜想思维范式全链条第二篇开篇黎曼猜想被公认为数学史上最伟大的未解难题。希尔伯特曾说：“如果我沉睡百年后醒来，第一个问题就是：黎曼猜想证明了吗&…

2026/5/23 0:02:38 阅读更多

在Nodejs后端服务中集成稳定可靠的大模型能力

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在Nodejs后端服务中集成稳定可靠的大模型能力应用场景类，针对需要构建智能对话或内容生成功能的后端工程师&#xff0…

2026/5/23 0:03:18 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/22 17:05:13 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/22 16:54:23 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/21 2:29:29 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/22 14:41:35 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/22 11:03:47 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/22 3:58:33 阅读更多

相关文章

写给新手的 release-management：昇腾版本管理到底是啥？

写给新手 cann-recipes-spatial-intelligence：昇腾空间智能最佳实践到底是啥？

量子生成模型与高斯玻色采样的融合创新

不只是烧录：用Jetson Orin Nano + OpenCV 4.4.0 + ROS Noetic搭建你的第一个边缘视觉AI项目

告别开发依赖！SAP顾问必学的SQ01/SQ02/SQ03实战：5步搞定自定义报表

DocKit v1.0 发布 — AI 原生 NoSQL 桌面客户端，支持 Elasticsearch、OpenSearch 和 DynamoDB，本地优先，Apache 2.0 开源

21.jdbc 学习笔记：从原理到实践的全流程梳理

DSP28337D的ePWM保护机制：Trip-Zone模块的三种触发方式与实战配置（附代码）

Ubuntu 20.04离线安装ntpdate保姆级教程（附arm64/amd64包下载与依赖解决）

红黑树完全指南：从五条性质到完整插入删除实现

黎曼猜想：哲学 × 数学 思维范式全链条

在Nodejs后端服务中集成稳定可靠的大模型能力

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

黎曼猜想：哲学 × 数学思维范式全链条

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)