这一讲解决什么问题从这一讲开始,我们进入第四篇:Agent 能力扩展篇前面第三篇,我们已经完成了单 Agent 的核心实现能力:Agent Loop Tool 工程 状态管理 Memory这些能力可以让 Agent 围绕一个目标执行任务、调用工具、记录进度、记住长期偏好。但还有一个非常常见的问题没有解决:Agent 如何使用外部知识?模型本身虽然懂很多通用知识,但它不一定知道:你公司的内部文档当前项目的接口说明最新的产品需求团队约定和规范最近的故障复盘用户上传的 PDF某个仓库里的 README某个系统的运维手册某个课程项目的历史大纲如果 Agent 只依赖模型自己的参数知识,就会出现几个问题:它不知道私有资料它不知道最新变化它可能编造不存在的内容它无法给出可靠引用来源它很难在企业内部场景落地
第 13 讲:RAG:让 Agent 接入知识库
这一讲解决什么问题从这一讲开始,我们进入第四篇:Agent 能力扩展篇前面第三篇,我们已经完成了单 Agent 的核心实现能力:Agent Loop Tool 工程 状态管理 Memory这些能力可以让 Agent 围绕一个目标执行任务、调用工具、记录进度、记住长期偏好。但还有一个非常常见的问题没有解决:Agent 如何使用外部知识?模型本身虽然懂很多通用知识,但它不一定知道:你公司的内部文档当前项目的接口说明最新的产品需求团队约定和规范最近的故障复盘用户上传的 PDF某个仓库里的 README某个系统的运维手册某个课程项目的历史大纲如果 Agent 只依赖模型自己的参数知识,就会出现几个问题:它不知道私有资料它不知道最新变化它可能编造不存在的内容它无法给出可靠引用来源它很难在企业内部场景落地
相关文章
PCF8591与PIC32MZ2048EFM100的硬件协同设计与同步采样实现
1. PCF8591与PIC32MZ2048EFM100的硬件协同设计 在嵌入式信号处理系统中,ADC(模数转换器)和DAC(数模转换器)是连接模拟世界与数字世界的桥梁。PCF8591作为一款经典的8位AD/DA转换芯片,与高性能的PIC32MZ2048…
Zotero-SciHub插件:5分钟掌握学术文献PDF自动下载终极指南
Zotero-SciHub插件:5分钟掌握学术文献PDF自动下载终极指南 【免费下载链接】zotero-scihub A plugin that will automatically download PDFs of zotero items from sci-hub 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-scihub 还在为下载学术文献P…
028、二阶统计的威力:SAN二阶注意力网络的数学推导与代码实现
028、二阶统计的威力:SAN二阶注意力网络的数学推导与代码实现从一次失败的实验说起 去年夏天,我在处理一组医疗CT图像的超分任务时,遇到了一个让人头疼的问题。用RCAN(残差通道注意力网络)训练了三天,PSNR卡…
从电视盒子到服务器:Armbian系统改造终极指南
从电视盒子到服务器:Armbian系统改造终极指南 【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, s905w, s905, s905l, rk3588, rk3568, …
企业网站改版指南:盘点7个关键指标
在互联网高速迭代的今天,企业官网早已不再是简单的“网络名片”,而是承接流量、转化客户的核心阵地。然而,许多企业都面临着这样的困境:当初耗费大量时间、人力与资金精心搭建的网站,在历经数载风雨后,逐渐…
AI模型部署优化:延迟与显存管控实战技巧
1. 模型部署优化的核心挑战在工业级AI应用场景中,模型部署环节往往比模型开发更考验工程师的技术功底。最近处理一个图像识别项目时,客户现场反馈的GPU显存溢出问题让我深刻体会到:模型部署不是简单的格式转换,而是需要从计算图优…
ISTA 3B:货物运输的全真模拟闯关,告别零担货损烦恼
做零担发货的商家几乎都有同款烦恼:货物和各式各样货品混装一车,辗转多个中转仓,等到送达客户手上,难免出现箱体磕碰、内部零件损坏。不停赔付、丢失客户,包装成本越花越多,破损问题却始终治标不治本。今天…
合成数据工程化实践:规则、蒸馏与强化的混合方法论
1. 为什么今天必须认真对待合成数据——一个一线ML工程师的切肤之痛去年底,我带队做金融风控大模型微调时卡在了最后一步:业务方只肯提供237条脱敏后的坏样本,而模型在验证集上F1值始终卡在0.61上下晃荡。我们试过SMOTE、ADASYN这些传统过采样…
GPT-4o反应时间解析:230ms如何重构人机交互实时性
1. 项目概述:这不是一次普通的产品发布,而是一次人机交互范式的临界点突破“OpenAI春季发布会:GPT-4o登场!与人类反应时间相近?”——这个标题里藏着一个被多数人忽略的关键词:反应时间。它不是在说“模型多…
Selenium元素定位全解析:从八大方法到实战策略
1. 项目概述:从“找东西”到“精准操控” 做自动化测试,尤其是Web UI自动化,最核心也最让人头疼的一步是什么?不是写复杂的业务逻辑,也不是处理异步加载,而是最基础的—— 让程序找到页面上那个你想操作的…
移动端UI自动化测试框架Maestro终极指南:从入门到实战
1. 项目概述:为什么是Maestro? 如果你正在寻找一个能让你快速上手、告别繁琐配置、并且对移动端UI自动化测试真正友好的框架,那么Maestro很可能就是你一直在等的那个答案。我接触过Appium、Espresso、XCUITest,也折腾过各种基于图…
BurpSuite Cluster Bomb模式深度避坑指南:从原理到实战的完整爆破策略
1. 项目概述:从“能用”到“精通”的必经之路如果你正在学习或从事网络安全测试,尤其是Web应用安全评估,那么BurpSuite的Intruder模块绝对是你绕不开的核心工具。而Intruder模块里,功能最强大、也最让人又爱又恨的,莫过…
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
华为OD机试2025C卷-字符统计及重排[100分]( Java _ Python3 _ C++ _ C语言 _ JsNode _ Go)实现100%通过率
📫 个人主页:深夜coding算法 📣 专栏系列:2026年华为最新OD机试题库详解 🔥 一次订阅,永久解锁 | 持续更新100篇 | 6语言全覆盖 文章目录❄️前言:☀️一:题目描述🌙 题目…
华为OD机试2025C卷-寻找相同子串[100分]( Java _ Python3 _ C++ _ C语言 _ JsNode _ Go)实现100%通过率
📫 个人主页:深夜coding算法 📣 专栏系列:2026年华为最新OD机试题库详解 🔥 一次订阅,永久解锁 | 持续更新100篇 | 6语言全覆盖 文章目录❄️前言:☀️一:题目描述🌙 题目…
FAE放射组学分析工具:医学影像特征探索的完整解决方案
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
0.69B参数实现中文多模态AI:揭秘Qwen3-SmVL模型融合技术的完整实战指南
0.69B参数实现中文多模态AI:揭秘Qwen3-SmVL模型融合技术的完整实战指南 【免费下载链接】happy-llm 📚 从零开始构建大模型 项目地址: https://gitcode.com/GitHub_Trending/ha/happy-llm 还在为大型多模态模型动辄数十亿参数、显存占用高而烦恼&…
解锁AMD Ryzen处理器性能潜力的SMU调试神器:从新手到专家的完整指南
解锁AMD Ryzen处理器性能潜力的SMU调试神器:从新手到专家的完整指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址…