RAG-查询前处理

发布时间：2026/6/27 13:53:26

**“**查询前处理是在用户提问之后RAG系统去做检索查询之前做的事情。为了系统能够给出最精确的回答需要在查询的过程做些优化。”前面文章我们介绍了向量数据库Text2SQL查询MySQL的知识内容。了解了在RAG系统中会存在多个不同的数据库。那么问题来了用户提出问题什么问题会去检索向量数据库的内容什么问题会Text2SQL查询MySQL数据库的信息呢又或者用户提出的问题是否两个数据库都要检索查询呢。这就引出了本文所要分享的内容查询前处理。查询前处理是在用户提问之后RAG系统去做检索查询之前做的事情。为了系统能够给出最精确的回答需要在查询的过程做些优化。其实就是调用LLM模型将用户提出的问题处理一遍再进行下一步动作。以下是查询前处理的一些思路。01—查询改写在用户提出问题后调用LLM大模型看下问题描述是否清晰。如果问题描述不清晰让LLM大模型对问题进行改写改写成更适合检索表结构、字段、示例的标准问题。比如提问今年一二月大概赚了多少钱各项收入和纯利润分别是多少呀改写后今年1月至2月的净利润和各项收入明细是多少流程图代码样例from openai import OpenAI import os from dotenv import load_dotenv load_dotenv() # 配置你的大模型API API_KEY os.getenv(R_PROXY_AI_API_KEY) BASE_URL os.getenv(R_PROXY_AI_BASE_URL) MODEL os.getenv(MODEL) # DeepSeek、openAI都可以 client OpenAI( base_urlBASE_URL, api_keyAPI_KEY ) def finance_rewrite_query(question: str) - str: 财务业务专用用户口语问题清洗重写 prompt 你是财务数据分析助手对用户的财务问题进行重写优化。规则 1. 去掉无关闲聊、个人感慨、语气助词、废话 2. 替换为标准财务术语净利润、主营业务收入、应收账款、应付账款、管理费用、资产负债等 3. 保留原始查询核心意图时间、维度、统计诉求 4. 把模糊口语改成精准可查询的问句只返回重写后的问题不要任何解释、不要多余文字。原始问题{question} response client.chat.completions.create( model MODEL, messages[{role: user, content: prompt.format(questionquestion)}], temperature0 ) return response.choices[0].message.content.strip() # 测试财务口语问题 if __name__ __main__: raw_q 今年一二月大概赚了多少钱各项收入和纯利润分别是多少呀 print(原始问题, raw_q) print(重写后, finance_rewrite_query(raw_q))02—查询拆分在用户提出问题后调用LLM大模型将问题拆分成几个小问题系统对每个小问题进行检索查询。流程图代码样例from openai import OpenAI import os import logging from dotenv import load_dotenv from langchain_chroma import Chroma from langchain_community.document_loaders import TextLoader from langchain_huggingface import HuggingFaceEmbeddings from langchain_text_splitters import RecursiveCharacterTextSplitter from langchain.retrievers.multi_query import MultiQueryRetriever # 加载环境 load_dotenv() logging.basicConfig() logging.getLogger(langchain.retrievers.multi_query).setLevel(logging.INFO) # 你的 LLM 配置 API_KEY os.getenv(R_PROXY_AI_API_KEY) BASE_URL os.getenv(R_PROXY_AI_BASE_URL) MODEL os.getenv(MODEL) llm OpenAI( base_urlBASE_URL, api_keyAPI_KEY, default_headers{ User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 } ) # 1. 加载财务知识库文档 # 你可以换成你的财务制度/报销规则文档 loader TextLoader(你的财务知识库.txt, encodingutf-8) data loader.load() text_splitter RecursiveCharacterTextSplitter(chunk_size500, chunk_overlap100) splits text_splitter.split_documents(data) # 向量库 embed_model HuggingFaceEmbeddings(model_nameBAAI/bge-small-zh) vectorstore Chroma.from_documents(documentssplits, embeddingembed_model) # 2. 多问题检索器自动拆分问题 from langchain_openai import ChatOpenAI # 包装成 LangChain LLM必须这一步才能用 MultiQueryRetriever langchain_llm ChatOpenAI( base_urlBASE_URL, api_keyAPI_KEY, modelMODEL, temperature0 ) # 核心自动把用户问题拆成多个子问题自动检索 multi_query_retriever MultiQueryRetriever.from_llm( retrievervectorstore.as_retriever(search_kwargs{k: 3}), llmlangchain_llm ) # 3. 测试财务复杂问题 if __name__ __main__: # 你的复杂问题包含多个诉求 raw_query 今年一二月大概赚了多少钱各项收入和纯利润分别是多少呀 print(原始问题, raw_query) print( * 80) # 自动拆分自动检索 docs multi_query_retriever.invoke(raw_query) print(最终检索到的文档) for idx, doc in enumerate(docs): print(f\n【文档 {idx1}】) print(doc.page_content)03—生成HyDE假设性文档在用户提出问题后调用LLM大模型把问题回答一遍生成假设性文档HyDE (Hypothetical Document Embeddings)再把这篇HyDE文档做向量去Milvus做相似度检索。流程图代码样例# 财务场景 HyDE 实现 from langchain.prompts import ChatPromptTemplate from langchain_core.output_parsers import StrOutputParser from langchain_openai import ChatOpenAI from langchain_huggingface import HuggingFaceEmbeddings from langchain_chroma import Chroma from dotenv import load_dotenv import os # 加载环境变量 load_dotenv() API_KEY os.getenv(R_PROXY_AI_API_KEY) BASE_URL os.getenv(R_PROXY_AI_BASE_URL) MODEL os.getenv(MODEL) # 1. 初始化 LLM llm ChatOpenAI( base_urlBASE_URL, api_keyAPI_KEY, modelMODEL, temperature0 ) # 2. 财务知识库向量库你已有的 # 这里你可以继续用你的财务制度/报销文档 embed_model HuggingFaceEmbeddings(model_nameBAAI/bge-small-zh) vectorstore Chroma( embedding_functionembed_model, persist_directory./chroma_db # 你已有的向量库 ) retriever vectorstore.as_retriever(search_kwargs{k: 3}) # 3. 【财务专用】HyDE 假设文档生成模板 hyde_template 你是一位专业的财务分析师请根据以下财务问题撰写一段专业、详细、结构完整的假设性财务分析文档。不需要真实数据只需模拟正式的财务报告内容用于文档检索。问题{question} 财务分析文档 hyde_prompt ChatPromptTemplate.from_template(hyde_template) # 构建 HyDE 文档生成链 hyde_chain hyde_prompt | llm | StrOutputParser() # 4. 测试你的财务问题 if __name__ __main__: # 你的真实业务问题 question 今年一二月大概赚了多少钱各项收入和纯利润分别是多少呀 print(原始问题) print(question) print( * 80) # --------------------- ① 生成 HyDE 假设文档 --------------------- hyde_doc hyde_chain.invoke({question: question}) print(生成的 HyDE 假设性财务文档) print(hyde_doc) print( * 80) # --------------------- ② 用 HyDE 文档去检索真实知识库 --------------------- retrieved_docs retriever.invoke(hyde_doc) print(根据 HyDE 文档检索到的财务知识) for i, doc in enumerate(retrieved_docs, 1): print(f\n检索文档 {i}:) print(doc.page_content) print( * 80) # --------------------- ③ 最终生成答案 --------------------- answer_prompt ChatPromptTemplate.from_template( 你是专业财务助手请根据检索到的财务资料准确回答用户问题。资料 {context} 用户问题{question} 请给出专业、简洁、清晰的回答 ) final_chain answer_prompt | llm | StrOutputParser() final_answer final_chain.invoke({ context: retrieved_docs, question: question }) print(最终财务回答) print(final_answer)04—查询路由按问题领域分到不同的数据库比如统计类问题查询MySQL数据语义相关问题检索Milvus向量数据库数据。调用LLM模型分析问题走哪个数据库进而进行相对应数据库的查询。流程图代码样例from langchain_core.prompts import ChatPromptTemplate from langchain_openai import ChatOpenAI from dotenv import load_dotenv import os import json # 加载环境 load_dotenv() API_KEY os.getenv(R_PROXY_AI_API_KEY) BASE_URL os.getenv(R_PROXY_AI_BASE_URL) MODEL os.getenv(MODEL) # LLM llm ChatOpenAI( base_urlBASE_URL, api_keyAPI_KEY, modelMODEL, temperature0 ) # 路由提示词 system_prompt 你是专业财务数据路由专家只按规则判断输出纯JSON不要其他内容。规则 1统计、数值、收入、利润、金额、报表 → mysql 2制度、报销、流程、规则、政策、定义 → milvus 输出格式 {{datasource: mysql}} 或 {{datasource: milvus}} prompt ChatPromptTemplate.from_messages([ (system, system_prompt), (human, {question}) ]) # 构建路由链 route_chain prompt | llm # 执行路由 def finance_route_question(question: str) - str: response route_chain.invoke({question: question}) result json.loads(response.content.strip()) return result[datasource] # 测试 if __name__ __main__: q1 今年一二月收入和净利润是多少 q2 财务报销流程是什么 print(问题1, q1) print(路由结果, finance_route_question(q1)) print(- * 50) print(问题2, q2) print(路由结果, finance_route_question(q2))05—总结查询前处理的目的是为了让我们RAG系统能够给出最精确的回答学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

卷积改进与轻量化：重参数化再升级：RepConv 引入多尺度分支，训练期提取多感受野特征，推理单路无损

一、问题缘起：当单结构不再够用 2026年已经过半，计算机视觉模型在边缘端的部署需求持续井喷。根据Ultralytics官方博客在2026年4月发布的信息，YOLO26 Nano模型在标准CPU上的推理速度较YOLO11提升了高达43%，这标志着边缘AI进入了一个新的加速周期。然而，这个成绩的背后隐藏…

2026/6/26 14:41:16 阅读更多

3步解锁网易云音乐NCM格式：ncmdumpGUI图形化转换工具完全指南

3步解锁网易云音乐NCM格式：ncmdumpGUI图形化转换工具完全指南【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换，Windows图形界面版本项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾经在网易云音乐下载了心爱的…

2026/6/13 19:21:36 阅读更多

CANN/driver：昇腾芯片物理ID转换

dcmi_get_device_logicid_from_phyid 【免费下载链接】driver 本项目是CANN提供的驱动模块，实现基础驱动和资源管理及调度等功能，使能昇腾芯片。项目地址: https://gitcode.com/cann/driver 函数原型 int dcmi_get_device_logicid_from_phyid(u…

2026/6/24 17:15:34 阅读更多

IDEA AI Coding Assistant深度测评（2024企业级实测报告）：响应延迟＜280ms、代码采纳率63.7%、误报率仅4.2%

更多请点击： https://kaifayun.com 第一章：IDEA AI Coding Assistant深度测评（2024企业级实测报告）概述 JetBrains 在 2024 年正式将 AI Coding Assistant 深度集成至 IntelliJ IDEA Ultimate 2024.1 版本，不再依赖插…

2026/6/27 14:44:21 阅读更多

智能雾化器电路设计与优化实践

1. 智能雾化器电路设计解析从原理图来看，这是一个典型的基于微控制器的智能雾化器控制系统。整个电路由电源管理、MCU主控、雾化片驱动、传感器检测和人机交互五大模块组成。我们先从整体架构开始分析：电源部分采用12V输入，通过LM2596降压至5…

2026/6/27 14:42:59 阅读更多

LoRa+WiFi/4G远程光照监测系统设计与实现

1. 项目概述这个开源项目实现了一个远程光照监测系统，核心功能是通过LoRa无线技术采集传感器数据，再通过WiFi或4G网络将数据传输到云端或本地服务器。整套方案特别适合部署在那些没有传统网络覆盖的户外环境，比如农田、森林、偏远工地等场景。…

2026/6/27 14:42:39 阅读更多

Parse Server：自己搭后端，不用再求人

文章目录Parse Server：自己搭后端，不用再求人它能干什么部署方式版本和兼容性适合谁用总结Parse Server：自己搭后端，不用再求人做 App 开发最头疼的事之一，就是后端。自己写一套用户系统、数据存储、接口逻辑&#x…

2026/6/27 14:41:18 阅读更多

电子元器件基础：从电阻到集成电路的全面指南

1. 从零开始认识电子元器件作为一名在电子行业摸爬滚打十多年的老工程师，我见过太多初学者面对琳琅满目的电子元件时露出的迷茫表情。记得我刚入行时，也曾把电阻和电容搞混，把三极管引脚接反导致整个电路板冒烟。这些看似基础的知识&#xff…

2026/6/27 14:39:56 阅读更多

STM32F407开发板设计与教学应用实践

1. 项目背景与需求分析STM32F407开发板作为嵌入式系统教学与实验的核心载体，在工科院校实验室建设中具有重要地位。武汉交通职业学院这类以培养应用型技术人才为目标的高职院校，对开发板的设计有着特殊需求：教学适配性：需要平衡理…

2026/6/27 14:39:15 阅读更多

千问AI眼镜：阿里AI战略急先锋，能否在激烈竞争中突围？

千问眼镜：销量第一背后的挑战不久前，不少第三方统计机构给千问背书，甚至给出全国销量第一的统计结果。这个第一的含金量有多高？暂且先打个问号。但这些榜单至少说明，千问眼镜延续了阿里AI战略整体偏激进的风格&#xf…

2026/6/27 0:01:13 阅读更多

Tomcat中X-Frame-Options配置实战：防御点击劫持的四种方法与最佳实践

1. 项目概述：为什么X-Frame-Options是Web安全的“防盗门”？最近在排查一个老项目的安全审计报告时，又被提到了“点击劫持”风险，矛头直指缺失的X-Frame-Options响应头。这已经不是第一次了，很多开发团队，尤…

2026/6/27 0:01:34 阅读更多

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南

10分钟AI语音克隆与实时变声：Retrieval-based-Voice-Conversion-WebUI完整指南【免费下载链接】Retrieval-based-Voice-Conversion-WebUI Easily train a good VC model with voice data < 10 mins! 项目地址: https://gitcode.com/GitHub_Trending/re/Retrie…

2026/6/27 0:04:02 阅读更多

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”，而是Google埋下的第一道技术门槛你看到标题里那个醒目的“$300美金”时，第一反应可能是：又一个免费额度？领完就完事？我亲手试过——这300美金根本不是红包，而是一张入场券&…

2026/6/27 1:16:50 阅读更多

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程

PDF对比终极指南：用diff-pdf轻松识别文档差异的完整教程【免费下载链接】diff-pdf A simple tool for visually comparing two PDF files 项目地址: https://gitcode.com/gh_mirrors/di/diff-pdf 还在为PDF文档的版本对比而烦恼吗？diff-pdf这款开…

2026/6/27 1:16:49 阅读更多

嵌入式GUI控件实战：ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件：从原理到实战的深度解析在嵌入式系统开发中，图形用户界面（GUI）的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台，嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/27 1:16:48 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/27 12:47:04 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/27 13:25:14 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/27 13:25:16 阅读更多

相关文章