001：简单 RAG 入门

发布时间：2026/5/17 15:52:53

lamaIndex 示例千问文件名01_LlamaIndex.pyimport os from llama_index.llms.dashscope import DashScope, DashScopeGenerationModels from llama_index.embeddings.dashscope import DashScopeEmbedding from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings from dotenv import load_dotenv os.environ[USER_AGENT] my-rag-app/1.0 load_dotenv() DATA_DIR ./data # 1. 配置 LLM Settings.llm DashScope( model_nameDashScopeGenerationModels.QWEN_MAX, api_keyos.getenv(DASHSCOPE_API_KEY) ) # 2. 设置嵌入模型 Settings.embed_model DashScopeEmbedding( model_nametext-embedding-v2, api_keyos.getenv(DASHSCOPE_API_KEY), timeout60, # 增加超时时间 max_retries5 # 增加重试次数 ) # 3. 加载与索引 if not os.path.exists(DATA_DIR): print(f错误未找到路径 {DATA_DIR}) else: # 建议直接使用绝对路径避免相对路径带来的困扰 print(正在加载文档...) documents SimpleDirectoryReader(DATA_DIR).load_data() print(正在创建索引此步涉及 Embedding 接口调用...) index VectorStoreIndex.from_documents(documents) # 4. 查询 query_engine index.as_query_engine() print(正在提问...) response query_engine.query(2026春运时间是什么时候) print(fAI 回答结果\n{response})运行方式python 01_LlamaIndex.py运行结果正在加载文档... 正在创建索引此步涉及 Embedding 接口调用... 正在提问... AI 回答结果 2026年春运的时间是从2月2日至3月13日。LangChain 示例DeepSeek文件名02_LangChain_DeepSeek.pyimport os from dotenv import load_dotenv os.environ[USER_AGENT] my-rag-app/1.0 load_dotenv() # 1. 加载数据 from langchain_community.document_loaders import TextLoader # 随便复制一些即时新闻放到 txt 文件中例如https://baike.baidu.com/item/2026%E5%B9%B4%E6%98%A5%E8%BF%90/66941026?fromModulehome_hotspot loader TextLoader( file_pathdata/a.txt, encodingutf-8 # 如果是中文文件确保使用 utf-8 编码 ) docs loader.load() # 2. 文档分块 from langchain_text_splitters import RecursiveCharacterTextSplitter text_splitter RecursiveCharacterTextSplitter(chunk_size1000, chunk_overlap200) all_splits text_splitter.split_documents(docs) # 3. 设置嵌入模型 # 使用本地 HuggingFace 模型推荐免费且稳定可能需要科学网络 from langchain_huggingface import HuggingFaceEmbeddings embeddings HuggingFaceEmbeddings( model_nameBAAI/bge-small-zh-v1.5, # 中文模型 model_kwargs{device: cpu}, encode_kwargs{normalize_embeddings: True} ) # 4. 存到向量数据库中为了方便测试这里使用内存数据库 from langchain_core.vectorstores import InMemoryVectorStore vector_store InMemoryVectorStore(embeddings) vector_store.add_documents(all_splits) # 5. 构建用户查询针对前面的即时新闻提问 question 2026春运时间是什么时候 # 6. 在向量数据库中搜索最相似的文档 retrived_docs vector_store.similarity_search(question, k3) docs_content \n\n.join(doc.page_content for doc in retrived_docs) # 7. 构建提示模板 from langchain_core.prompts import ChatPromptTemplate prompt ChatPromptTemplate.from_template( 基于以下上下文回答问题。如果没有结果就说没有找到对应信息。上下文: {context} 问题: {question} 回答: ) # 8. 把结果和问题都发给大模型生成答案 from langchain_deepseek import ChatDeepSeek llm ChatDeepSeek( modeldeepseek-chat, # DeepSeek API 支持的模型名称 temperature0.7, # 随机性 max_tokens2048, # 最大输出长度 api_keyos.getenv(DEEPSEEK_API_KEY) # 从环境变量加载API key ) answer llm.invoke(prompt.format(questionquestion, contextdocs_content)) print(answer.content) # 只打印回答内容

DevEco Studio配置与OpenHarmony-L2应用开发避坑指南

DevEco Studio配置与OpenHarmony-L2应用开发避坑指南在万物互联的时代，OpenHarmony作为新一代智能终端操作系统，正在吸引越来越多开发者的关注。而作为OpenHarmony官方推荐的集成开发环境，DevEco Studio无疑是开发者的首选工具。本文将深入探…

2026/5/17 15:51:20 阅读更多

游戏语言不通？XUnity翻译器让外文游戏秒变中文

游戏语言不通？XUnity翻译器让外文游戏秒变中文【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 面对心爱的外文游戏却因语言障碍无法沉浸体验？作为全球数百万玩家的选择&#xff0c…

2026/5/17 3:01:50 阅读更多

5步打造静音电脑：开源风扇控制工具FanControl新手教程

5步打造静音电脑：开源风扇控制工具FanControl新手教程【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa…

2026/5/17 3:01:50 阅读更多

HttpOnly Cookie 深度解析

一、什么是 HttpOnly Cookie HttpOnly 是一个可以附加在 Set-Cookie 响应头上的标志位（flag）。当一个 Cookie 被标记为 HttpOnly 后，客户端脚本（如 JavaScript）将无法通过 document.cookie 等 API 访问该 Cookie&…

2026/5/17 11:08:34 阅读更多

GA/T 1400视图库实战：从零部署Easy1400平台到设备级联全流程解析

1. 初识GA/T 1400与Easy1400平台第一次接触GA/T 1400标准时，我完全被各种专业术语绕晕了。简单来说，这是一套专门针对视频监控领域的行业标准，规定了视频图像信息在采集、传输、存储等环节的技术要求。而Easy1400就是基于这个标准开发的一套…

2026/5/17 11:08:34 阅读更多

OAuth 2.0 and OIDC 三大安全机制对比：State vs Nonce vs PKCE

一、问题背景 OAuth 2.0 和 OpenID Connect 的授权流程依赖浏览器重定向，这天然暴露了多种攻击面： 攻击类型描述CSRF攻击者诱导用户的浏览器携带恶意授权码完成绑定Token 重放窃取的 id_token 被重复提交给客户端授权码劫持恶意应用在同一设备上拦截授…

2026/5/17 11:08:34 阅读更多

AI驱动i18n翻译：基于LLM的JSON本地化文件批量处理实践

1. 项目概述与核心价值最近在折腾一个多语言项目，需要把几百条中文文案翻译成英文、日文、法文等十几种语言。手动翻译？不现实，成本高、周期长、一致性还难保证。用传统的翻译API？虽然方便，但面对专业术语、产品特有名…

2026/5/17 11:07:33 阅读更多

Cloudflare Sandbox SDK：本地开发无缝调用云端服务的RPC解决方案

1. 项目概述：一个被低估的云端开发利器如果你正在寻找一种能让你在本地开发环境中，就能安全、高效地调用云端服务的方法，那么cloudflare/sandbox-sdk绝对是一个值得你花时间研究的项目。乍看之下，这个名字可能有些抽象——“沙盒S…

2026/5/17 11:07:33 阅读更多

基于MCP协议构建巴西开放数据网关：架构设计与工程实践

1. 项目概述：一个为巴西数据开放平台量身定制的MCP服务器如果你正在开发一个需要接入巴西官方开放数据平台（Dados Abertos）的应用，或者你是一名数据分析师、研究员，希望以编程化的方式高效、稳定地获取巴西的各类公共数…

2026/5/17 11:07:12 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

站内源码及jar包下载一、项目概述文件下载中心一个基于 Java 内置 HTTP 服务器（com.sun.net.httpserver）构建的轻量级文件管理服务。它零第三方依赖，单 JAR 包即可运行，适合在内网环境或临时场景中快速搭建文件共享站点。你的团队需要临时共享一批日志文件或交付物，…

2026/5/17 0:01:09 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/17 0:01:09 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南【免费下载链接】markor Text editor - Notes & ToDo (for Android) - Markdown, todo.txt, plaintext, math, .. 项目地址: https://gitcode.com/gh_mirrors/ma/markor 在移动设备上寻找一款…

2026/5/17 0:02:11 阅读更多

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

2026/5/17 0:01:09 阅读更多

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

加密位置: 逆向接口参数: 逆向接口: const g = globalThis; g.window = g; g.self = g; g.location = {<

2026/5/17 0:01:09 阅读更多

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

2026/5/17 0:02:11 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/16 21:19:19 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/16 19:35:34 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/16 17:57:38 阅读更多

相关文章

DevEco Studio配置与OpenHarmony-L2应用开发避坑指南

游戏语言不通？XUnity翻译器让外文游戏秒变中文

5步打造静音电脑：开源风扇控制工具FanControl新手教程

HttpOnly Cookie 深度解析

GA/T 1400视图库实战：从零部署Easy1400平台到设备级联全流程解析

OAuth 2.0 and OIDC 三大安全机制对比：State vs Nonce vs PKCE

AI驱动i18n翻译：基于LLM的JSON本地化文件批量处理实践

Cloudflare Sandbox SDK：本地开发无缝调用云端服务的RPC解决方案

基于MCP协议构建巴西开放数据网关：架构设计与工程实践

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

【实用小程序】超轻量级文件上传下载中心 (File Download Server)

py每日spider案例之某website之xin东方选课搜索接口(难度一般 扣取代码即可)

终极轻量级Android文本编辑器Markor：多格式笔记应用完全指南

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)

py每日spider案例之某website之xin东方选课搜索接口(难度一般扣取代码即可)