Deep Agents Context Engineering

发布时间：2026/6/3 1:40:08

上下文工程Context Engineering是构建高效、智能的Deep Agents深度智能体的核心环节。摘要上下文工程是构建高效、智能Deep Agents深度智能体的核心。它通过精心设计和管理Agent的“工作记忆”与“环境感知”为其提供精准、相关且结构化的信息以支撑复杂的推理、决策与行动。本文系统性地介绍了上下文工程的四大支柱输入上下文任务执行的直接输入、运行时上下文任务执行的过程轨迹、上下文压缩突破模型窗口限制的精炼技术以及长期记忆实现个性化与连续性的跨会话存储。文章深入探讨了每类上下文的具体类型、使用场景、实现技术、最佳实践与核心挑战旨在为开发者构建更强大、更可靠的Agent系统提供清晰的架构指南。目录1. 引言2. 输入上下文的类型和使用场景3. 运行时上下文的介绍4. 上下文压缩(Context compression)5. 长期记忆/跨Session记忆Cross-Session Memory6. 总结它旨在为Agent提供精准、相关且结构化的信息以支持其进行推理、决策和行动。简单来说上下文就是Agent的“工作记忆”和“环境感知”决定了Agent能“看到”什么从而影响其“思考”和“行动”。根据信息的来源、生命周期和作用范围Deep Agents的上下文主要可分为以下几类输入上下文Input Context单次交互或任务执行时由用户或系统直接提供的即时信息。例如用户当前的问题、指令、上传的文件等。它是任务执行的直接输入。运行时上下文Runtime Context在单次任务执行周期内由Agent自身行动、工具调用结果、中间推理步骤等动态生成和积累的信息。它记录了任务执行的“过程轨迹”。压缩上下文Compressed Context通过摘要、提取、嵌入等压缩技术对冗长的历史上下文如长对话、长文档进行精炼后保留的核心信息。旨在突破模型上下文窗口的长度限制保留关键信息。长期记忆/跨会话记忆Long-term / Cross-Session Memory跨越多次独立会话或任务持久化存储的用户偏好、历史交互、学到的知识等。它为Agent提供了连续性和个性化能力。这四类上下文相互关联共同构成了Deep Agents的完整认知体系。接下来我们将对每种类型进行详细介绍。输入上下文的类型和使用场景输入上下文是Agent执行任务的“起跑线”其质量和形式直接影响任务的启动效果。主要类型和使用场景如下类型描述典型使用场景用户指令 (User Instruction)用户以自然语言形式表达的明确需求或命令。“帮我总结这篇技术文档的核心要点。” “预订下周五从北京到上海的航班。”对话历史 (Conversation History)当前会话中已发生的多轮对话记录。用于理解指代如“它”、“上面提到的”、维持对话连贯性、进行多轮任务分解。系统提示词 (System Prompt)预先定义的、用于塑造Agent角色、能力和行为规范的指令。定义Agent为“专业的编程助手”或“耐心的客服代表”并规定其回答风格和边界。检索增强信息 (Retrieved Information)从知识库、文档、网络等外部源实时检索得到的相关片段。回答需要最新或特定领域知识的问题如“LangChain最新版本有什么新特性”结构化数据输入 (Structured Data)以JSON、表格、键值对等形式提供的结构化信息。处理表单数据、API响应、数据库查询结果或接收来自其他系统的任务参数。多模态输入 (Multimodal Input)包含文本、图像、音频、视频等多种模态的信息。图像描述、视频内容分析、根据设计图生成代码、语音指令理解等。最佳实践清晰化确保用户指令明确无歧义。结构化尽可能将非结构化信息转化为结构化提示例如提供清晰的步骤或格式要求。相关性只提供与当前任务高度相关的信息避免信息过载。运行时上下文的介绍运行时上下文是Agent在单次任务执行过程中动态构建的“思维黑板”或“工作记忆”。它记录了从任务开始到结束的完整思维链和行动轨迹。核心组成部分思维链 (Chain-of-Thought, CoT)Agent内部推理的中间步骤。例如在解决数学问题时先分解问题再逐步计算。工具调用记录 (Tool Call History)Agent调用外部工具如计算器、搜索引擎、API的输入、输出和结果。这对于需要多步工具使用的复杂任务至关重要。行动历史 (Action History)在强化学习或自主行动场景中Agent所采取的行动序列及其产生的环境状态变化。中间状态 (Intermediate State)任务执行过程中产生的任何临时变量、决策点或评估结果。作用与价值可解释性通过查看运行时上下文开发者可以理解Agent的决策过程便于调试和优化。错误恢复当任务执行失败或出现意外时Agent可以回溯运行时上下文定位问题所在并尝试替代方案。状态维持对于长流程任务运行时上下文确保了Agent不会“忘记”之前已经完成或决定的事情。示例一个订餐Agent的运行时上下文可能包含用户说“我想吃披萨” - 思考“需要确认预算和地址” - 调用[用户信息查询工具]获取地址 - 调用[餐厅搜索API]找到附近披萨店 - 思考“按评分排序并推荐前3家” - 生成回复。上下文压缩(Context compression)随着交互的进行上下文尤其是对话历史和检索到的文档会变得越来越长很快便会超出语言模型LLM的上下文窗口限制。上下文压缩技术就是为了解决这一问题其目标是在不丢失关键信息的前提下大幅缩减上下文长度。主要压缩方法摘要 (Summarization)做法使用一个LLM对长文本进行总结生成一个更短的摘要版本。场景适用于长文档、长对话历史的整体回顾。例如将长达100轮的客服对话总结成“用户反映了网络延迟和账单问题已提供初步解决方案”。优点保留核心叙事和结论。缺点可能丢失细节和精确数据。提取 (Extraction)做法根据当前查询或任务从长上下文中精准提取出最相关的句子、短语或数据点。场景当只需要上下文中的某些特定信息时。例如从一篇长论文中提取所有关于“实验方法”的段落来回答相关问题。优点保留信息的原始性和精确性。缺点可能破坏信息的连贯性和上下文关联。上下文重排序 (Contextual Re-ranking)做法先通过检索获得大量相关片段然后使用一个更精细的模型重排序器对这些片段根据与问题的相关性进行重新排序最后只保留Top-K个最相关的片段。场景检索增强生成RAG系统中用于提升输入上下文的质量。优点显著提升输入信息的信噪比。缺点需要额外的重排序模型增加计算成本。技术选择在实际系统中这些方法常常组合使用。例如先对超长历史进行摘要再对摘要和当前查询进行相关性提取最后将压缩后的上下文喂给主Agent模型。长期记忆/跨Session记忆Cross-Session Memory长期记忆使Agent能够记住跨越不同时间、不同会话的信息从而实现个性化和连续性体验。它是构建“专属AI伙伴”的关键。实现方式与存储实现方式描述存储介质示例向量记忆 (Vector Memory)将记忆文本转换为向量嵌入存储到向量数据库中。查询时通过语义相似度搜索召回相关记忆。Pinecone, Weaviate, Chroma, pgvector摘要记忆 (Summary Memory)定期或按事件触发对近期对话或重要事件进行摘要并将摘要作为长期记忆存储。关系数据库 (如PostgreSQL), 文档数据库 (如MongoDB)缓冲记忆 (Buffer Memory)保存最近的若干轮对话如最后10轮。通常作为短期记忆但也可定期归档到长期存储。内存、Redis等高速缓存知识图谱记忆 (Knowledge Graph Memory)将记忆中的实体、关系、事件以图结构存储。便于进行复杂的关联推理。Neo4j, NebulaGraph核心功能用户画像构建记忆用户的偏好如“喜欢喝黑咖啡”、“是Java开发者”、习惯、禁忌等。会话连续性在新会话开始时Agent可以主动提及上次未完成的任务或基于历史进行问候如“您上次咨询的机票问题解决了吗”。学习与进化Agent可以从历史成功或失败的交互中学习优化未来的行为策略。挑战隐私与安全长期记忆涉及用户敏感数据必须严格加密和访问控制。记忆管理需要设计策略来决定记住什么重要性过滤、忘记什么记忆衰减或归档以及如何回忆基于当前情境的相关性检索。一致性当用户信息或偏好发生变化时需要更新相关记忆避免提供过时信息。应用示例一个学习助手Agent通过长期记忆记住用户“正在学习机器学习上周掌握了线性回归本周计划学习决策树”。在新会话中当用户问“监督学习有哪些算法”时Agent可以优先推荐决策树并关联到已学的线性回归进行对比讲解。6. 总结上下文工程是Deep Agents从“能执行简单指令”迈向“具备持续学习与复杂问题解决能力”的基石。本文梳理的四大类上下文——输入、运行时、压缩与长期记忆——构成了一个层次分明、相互协作的完整体系输入上下文是任务的起点决定了Agent的初始认知范围。运行时上下文是任务的“思维过程”保障了任务执行的可解释性与状态连续性。上下文压缩是应对信息过载的关键技术确保核心信息能有效传递。长期记忆是Agent实现个性化与进化能力的核心连接了过去、现在与未来。

Go 切片与数组内存分配底层差异：大数据量场景下的性能对比

Go 切片与数组内存分配底层差异：大数据量场景下的性能对比前言上个月在做特征工程平台的向量化改造时，遇到一个很有意思的选择题：一批用户画像 Embedding 数据（约 500 万条，每条 128 维 float32）&#xff…

2026/6/3 1:40:08 阅读更多

Untrunc终极指南：高效修复损坏视频文件的专业解决方案

Untrunc终极指南：高效修复损坏视频文件的专业解决方案【免费下载链接】untrunc Restore a truncated mp4/mov. Improved version of ponchio/untrunc 项目地址: https://gitcode.com/gh_mirrors/un/untrunc 视频修复工具、MP4恢复、开源视频恢复——这些关键…

2026/6/3 1:39:07 阅读更多

2026年阿里云OpenClaw/Hermes Agent配置Token Plan搭建建议收藏

2026年阿里云OpenClaw/Hermes Agent配置Token Plan搭建建议收藏。OpenClaw是开源的个人AI助手，Hermes Agent则是一个能自我进化的AI智能体框架。阿里云提供计算巢、轻量服务器及无影云电脑三种部署OpenClaw 与 Hermes Agent的方案、百炼Token Plan兼容主流 AI 工具&…

2026/6/3 1:38:06 阅读更多

二叉树专项（三）：平衡二叉树、红黑树

核心重点：BST缺陷与平衡树由来、AVL树定义与平衡因子、四大旋转原理、红黑树五大核心特性、变色与旋转机制、AVL与红黑树区别、TreeMap/TreeSet底层原理、高频面试问答全集一、前置铺垫：为什么需要平衡二叉树？我们回顾普通二叉搜索树（BST）的核心问题：BST 的形态完全依…

2026/6/3 2:38:30 阅读更多

ZYNQ开发避坑指南：手把手教你解决PS与DDR通信的Cache一致性问题

ZYNQ开发避坑指南：手把手教你解决PS与DDR通信的Cache一致性问题在嵌入式系统开发中，ZYNQ平台因其独特的ARM处理器（PS）与可编程逻辑（PL）协同架构而备受青睐。然而，这种异构计算模式也带来了特有的…

2026/6/3 2:38:30 阅读更多

实战对比：用pmdarima自动调参 vs 手动构建SARIMAX模型，预测光伏板温度哪个更准？

光伏板温度预测实战：pmdarima自动调参与SARIMAX手动建模深度对比光伏发电系统的效率与光伏板温度密切相关，准确预测温度变化对优化发电效率至关重要。在时间序列预测领域，SARIMAX模型因其对季节性和外生变量的处理能力而备受青睐。本文将深入…

2026/6/3 2:37:50 阅读更多

在CentOS 7上搞定Cadence IC618、XCELIUM和SPECTRE全家桶：一个Modulefile管理所有环境变量

在CentOS 7上搞定Cadence IC618、XCELIUM和SPECTRE全家桶：一个Modulefile管理所有环境变量对于IC设计工程师来说，Cadence工具链的安装和环境配置一直是个令人头疼的问题。每次新版本发布或者系统迁移，都需要重新折腾一遍环境变量，…

2026/6/3 2:37:29 阅读更多

STM32用CubeMX+HAL驱动PS2手柄的完整可运行工程（含按键/摇杆/震动识别）

本文还有配套的精品资源，点击获取简介：直接烧录就能用的STM32 PS2手柄通信工程，基于CubeMX图形化配置生成初始化代码，全程使用ST官方HAL库实现GPIO、定时器和中断控制。核心解码逻辑集中在ps2.c和ps2.h两个文件里，…

2026/6/3 2:37:29 阅读更多

民俗影像不再只是“存档”：Sora 2生成式记录让每场庙会自动产出3类合规交付物（含文旅部验收模板）

更多请点击： https://codechina.net 第一章：民俗影像不再只是“存档”：Sora 2生成式记录让每场庙会自动产出3类合规交付物（含文旅部验收模板） 传统庙会影像采集长期困于“拍完即止”——大量原始素材沉睡在硬盘中&…

2026/6/3 2:36:49 阅读更多

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

Unity打包EXE后Universal Media Player播放RTSP失败的深度修复指南当你在Unity中使用Universal Media Player（UMP）插件成功实现了RTSP流的播放，却在打包EXE后遭遇"无画面"或"找不到库文件"的错误时，这种从开发…

2026/6/3 0:00:49 阅读更多

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

1. 项目概述与核心价值在工业现场，数据采集的稳定性和准确性是命脉。无论是监测管道压力、罐体液位还是电机转速，我们都需要将物理世界的信号，可靠地转换为控制系统能理解的“语言”。这其中，4-20mA电流环信号堪称工业模拟信号传输…

2026/6/3 0:00:49 阅读更多

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

1. 项目概述：为FPV竞速增添专业感的DIY计时门如果你和我一样，家里有个对FPV无人机着迷的孩子，或者你自己就是个竞速爱好者，那你肯定理解那种想给自家的小型无人机赛道增加点“专业感”的冲动。我们在地下室用纸箱、呼啦圈搭过各种…

2026/6/3 0:00:49 阅读更多

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…

2026/6/2 3:04:55 阅读更多

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…

2026/6/2 3:51:01 阅读更多

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

1. 项目概述与核心思路最近在整理工作室的电子元件，翻出来几个闲置的街机按钮和一块树莓派Pico，灵机一动，决定做个简单又有趣的反应速度测试游戏。这个项目非常适合想入门嵌入式开发的朋友，它不涉及复杂的传感器和通信协议&#x…

2026/6/2 1:12:03 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/2 5:03:37 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/2 0:27:25 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/2 2:18:01 阅读更多

相关文章

Go 切片与数组内存分配底层差异：大数据量场景下的性能对比

Untrunc终极指南：高效修复损坏视频文件的专业解决方案

2026年阿里云OpenClaw/Hermes Agent配置Token Plan搭建建议收藏

二叉树专项（三）：平衡二叉树、红黑树

ZYNQ开发避坑指南：手把手教你解决PS与DDR通信的Cache一致性问题

实战对比：用pmdarima自动调参 vs 手动构建SARIMAX模型，预测光伏板温度哪个更准？

在CentOS 7上搞定Cadence IC618、XCELIUM和SPECTRE全家桶：一个Modulefile管理所有环境变量

STM32用CubeMX+HAL驱动PS2手柄的完整可运行工程（含按键/摇杆/震动识别）

民俗影像不再只是“存档”：Sora 2生成式记录让每场庙会自动产出3类合规交付物（含文旅部验收模板）

解决Unity打包EXE后Universal Media Player播放RTSP失败：从修改Player Settings到手动修复UMPPostBuilds.cs

ESP32工业物联网控制器：4-20mA压力变送器信号采集与处理实战

基于Arduino与超声波传感器的DIY无人机计时门设计与实现

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

基于树莓派Pico的反应速度测试游戏：从GPIO编程到状态机实战

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因