AI学习——向量数据库入门

发布时间：2026/5/26 13:12:20

向量数据库入门一、核心概念1. Chroma 是什么2. RecursiveCharacterTextSplitter 是什么3. 向量存储与检索二、完整入门代码第一步安装依赖第二步完整代码三、解释1. 文本分块 RecursiveCharacterTextSplitter2. Chroma 向量库3. 向量检索最关键四、运行结果五、升级使用真实中文向量模型六、总结一、核心概念1. Chroma 是什么轻量级、本地、免费、无需配置服务器的向量数据库专门用于RAG 入门学习数据存在你电脑文件夹里chroma_db功能存文本、生成向量、按语义搜索2. RecursiveCharacterTextSplitter 是什么LangChain 最标准、最常用的文本分块工具把长文章 → 小段文本chunk按换行 → 句号 → 逗号 → 空格递归切割不会硬切句子保留语义完整性3. 向量存储与检索存储文本 → 生成向量 → 存入 Chroma检索用户问题 → 生成问题向量 → 匹配最相似的文本段这就是RAG 的核心原理二、完整入门代码第一步安装依赖pipinstalllangchain chromadb langchain-community第二步完整代码# # 1. 导入所有需要的工具# fromlangchain.text_splitterimportRecursiveCharacterTextSplitter# 文本分块fromlangchain.vectorstoresimportChroma# 本地向量库fromlangchain.embeddingsimportFakeEmbeddings# 向量生成演示用# # 2. 准备一段长文本知识库# long_text 人工智能是一门让机器模拟人类智能的技术。大模型基于深度学习可以理解语言、生成内容、回答问题。 RAG 叫做检索增强生成用于让大模型准确引用外部知识减少幻觉。向量数据库用于存储文本的向量表示实现快速语义检索。 Chroma 是轻量级本地向量库非常适合学习和小型项目。 LangChain 是开发 AI 应用最常用的框架可以连接模型、向量库、分块工具。文本分块是 RAG 中非常关键的一步可以提高检索精度。 # # 3. 【核心】文本分块RecursiveCharacterTextSplitter# text_splitterRecursiveCharacterTextSplitter(chunk_size100,# 每一块最大长度chunk_overlap20,# 块之间重叠20字符防止语义断裂separators[\n,。,, ],# 按什么符号分割优先级从高到低length_functionlen# 用长度计算)# 执行分块chunkstext_splitter.split_text(long_text)# 查看分块结果print( 分块结果 )fori,cinenumerate(chunks):print(f块{i1}:{c})# # 4. 【核心】初始化 Chroma 向量库# embeddingsFakeEmbeddings(size1024)# 入门先用假向量跑通流程# 把分块后的文本存入 ChromadbChroma.from_texts(textschunks,embeddingembeddings,persist_directory./chroma_db# 本地保存路径)# 保存到磁盘db.persist()print(\n✅ 向量库存储完成数据保存在 chroma_db 文件夹)# # 5. 【核心】向量相似度检索# query什么是RAG# 用户问题print(f\n 用户问题{query})# 检索最相似的 2 条结果retrieved_docsdb.similarity_search(query,k2)# 输出结果print(\n 检索结果 )foridx,docinenumerate(retrieved_docs):print(f结果{idx1}:{doc.page_content})三、解释1. 文本分块 RecursiveCharacterTextSplitterchunk_size100# 每块最多100字符chunk_overlap20# 前后重叠20字符保证语义不断裂separators[\n,。,, ]# 优先按换行切 → 再按句号 → 再按逗号为什么要分块大模型一次读不完长文本检索需要小段内容才精准2. Chroma 向量库dbChroma.from_texts(textschunks,# 分块后的文本embeddingembeddings,# 向量模型persist_directory./chroma_db# 存在本地)运行后会自动生成文件夹chroma_db关闭程序数据不会丢失下次可直接加载使用3. 向量检索最关键db.similarity_search(query,k2)query用户问题k2返回最相似的2条内容按语义匹配不是关键词匹配四、运行结果分块结果块 1: 人工智能是一门让机器模拟人类智能的技术。块 2: 大模型基于深度学习可以理解语言、生成内容、回答问题。块 3: RAG 叫做检索增强生成用于让大模型准确引用外部知识减少幻觉。块 4: 向量数据库用于存储文本的向量表示实现快速语义检索。块 5: Chroma 是轻量级本地向量库非常适合学习和小型项目。块 6: LangChain 是开发 AI 应用最常用的框架可以连接模型、向量库、分块工具。块 7: 文本分块是 RAG 中非常关键的一步可以提高检索精度。 ✅ 向量库存储完成数据保存在 chroma_db 文件夹用户问题什么是RAG 检索结果结果 1: RAG 叫做检索增强生成用于让大模型准确引用外部知识减少幻觉。结果 2: 文本分块是 RAG 中非常关键的一步可以提高检索精度。五、升级使用真实中文向量模型把 FakeEmbeddings 替换成真实模型fromlangchain.embeddingsimportHuggingFaceEmbeddings embeddingsHuggingFaceEmbeddings(model_nameBAAI/bge-small-zh# 中文最强小模型)六、总结1. 长文本 → 分块RecursiveCharacterTextSplitter 2. 分块 → 生成向量 → 存入 Chroma 3. 用户问题 → 向量检索 → 拿到最相关知识这就是RAG 的完整底层流程。

Avogadro 2：5分钟快速掌握开源分子建模神器，开启化学可视化新体验

Avogadro 2：5分钟快速掌握开源分子建模神器，开启化学可视化新体验【免费下载链接】avogadroapp Avogadro is an advanced molecular editor designed for cross-platform use in computational chemistry, molecular modeling, bioinformatics, materia…

2026/5/26 13:12:00 阅读更多

ADC——ADC7606B驱动设计-1

声明：文中关于ADC7606B芯片功能和时序的图片来源于ADI官网 https://www.analog.com/cn/products/ad7606b.html一、ADC7606B芯片简介ADC7606B芯片是ADI公司的8通道、16bit、采样率达800 kSPS的模数转换芯片。该芯片支持单端模拟信号输入和双极性模拟信号输入&#xf…

2026/5/26 13:11:39 阅读更多

SpotiFlyer：多平台音乐下载工具

文章目录SpotiFlyer：多平台音乐下载工具SpotiFlyer：多平台音乐下载工具 SpotiFlyer是一个Kotlin多平台音乐下载工具，目前在GitHub上获得11143个Star。它支持Spotify、Youtube、Gaana、Jio-Saavn和SoundCloud等平台的内容下载。 SpotiFlyer支…

2026/5/26 13:10:59 阅读更多

不止于配置：用山景BP1048的硬件I2C驱动OLED屏实战（附完整代码）

山景BP1048硬件I2C驱动OLED屏实战：从寄存器操作到显示优化在嵌入式开发中，显示模块往往是项目交互的核心。当我们需要为山景BP1048芯片添加一个轻量级显示界面时，SSD1306 OLED屏以其高对比度和低功耗特性成为理想选择。本文将带你从硬件I2C配…

2026/5/27 1:48:17 阅读更多

别再只用STM32了！手把手教你用STM32+FPGA给点胶机做个‘聪明’的运动控制器（附S曲线算法避坑）

STM32FPGA运动控制器实战：从S曲线算法到点胶机精准控制在工业自动化领域，运动控制器的性能直接决定了设备的精度和效率。传统基于单片机的方案在简单应用中尚可应付，但当面对三维点胶机这类需要高精度轨迹控制的场景时，STM32单独作…

2026/5/27 1:48:17 阅读更多

DTOP环球嘉年华重构线下商业版图｜2026实体商家联盟化趋势解读

线下商业正在经历从「单店竞争」到「联盟共生」的底层转变。DTOP环球嘉年华以第四代联盟码为纽带，推动实体商家从孤岛走向网络。2026年，异业联盟不再是可选项，而是实体商业的必答题。一个深刻的行业变化正在线下商业体中悄然发生。过去五…

2026/5/27 1:46:56 阅读更多

Lattice LFCPNX-100 HSB+Fpga开发详解：2.2 Marvell MV-Q3244 Phy的Podl电路详解

1、概述在HSB项目中，FPGA serdes光口输出，经过电口PHY芯片转接为电口H-MTD口输出，在经过电口时，根据客户需求，需要使用PODL电路，进行同一根双绞线传输数据电源；在汽车和工业物联网等领域尤为重要…

2026/5/27 1:46:56 阅读更多

Win10更新太烦人？手把手教你用VBS脚本精准关闭usosvc服务（附恢复方法）

彻底掌控Windows更新：专业开发者必备的usosvc服务管理指南每次专注编码时被突如其来的系统更新打断，可能是最让开发者抓狂的体验之一。Windows 10的自动更新机制虽然保证了系统安全，却常常在最不恰当的时候占用宝贵资源。本文将深入剖析usosv…

2026/5/27 1:46:36 阅读更多

量子纠错码与低连接硬件：方向码的创新与应用

1. 量子纠错码与低连接硬件的挑战量子计算的核心难题之一是量子态的脆弱性。与环境相互作用导致的退相干效应，使得量子信息在计算过程中极易丢失。量子纠错码（QEC）通过将逻辑量子比特编码到多个物理量子比特中，为这一问题提供了解…

2026/5/27 1:45:15 阅读更多

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？

LVGL绘制平滑曲线避坑指南：为什么你的贝塞尔函数有毛刺？ 在嵌入式GUI开发中，贝塞尔曲线是实现流畅动画和优雅界面的核心工具。但许多开发者在使用LVGL绘制曲线时，总会遇到令人头疼的锯齿和毛刺问题。这背后隐藏着嵌入式设备特有的…

2026/5/27 0:00:16 阅读更多

告别手动输入！用Burpsuite插件captcha-killer-modified+ddddocr，5分钟搞定登录爆破验证码

自动化验证码识别实战：Burpsuite与ddddocr的高效联动方案验证码机制作为现代Web应用的基础安全防线，其对抗自动化攻击的能力直接影响系统安全性。但在安全测试领域，验证码往往成为效率瓶颈——传统手工识别方式让渗透测试人员每天浪费数小时在…

2026/5/27 0:00:36 阅读更多

中国AI岗位暴涨12倍，13种你没听过的AI岗位

2026年，中国AI岗位数量同比增长12倍，AI科学家月薪高达13.7万，高性能计算工程师出现“7个岗位抢1个人”的荒诞场面。与此同时，数据录入、基础财务分析、一线客服等岗位大幅下降。全球范围内，AI/ML岗位招聘量同比增长88%…

2026/5/27 0:03:59 阅读更多

施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录

更多请点击： https://codechina.net 第一章：施工现场安全事故预警准确率达94.6%？——解密某央企AI Agent边缘计算部署架构与3个月落地实录在华北某大型地铁盾构施工现场，一套轻量化AI Agent系统于2024年Q2完成全栈部署&#xff…

2026/5/26 2:55:24 阅读更多

附录 B：术语表

本术语表面向“从 MM 到 HMM”专栏阅读过程中的快速查阅。它不是内核 API 手册，而是把文章中反复出现的概念放到同一张地图上：先给出直观含义，再说明它在 Linux MM/HMM 语境里的作用。建议阅读方式： 初读专栏时，把它当…

2026/5/26 2:55:26 阅读更多

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…

2026/5/26 1:30:55 阅读更多

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案

MPC-BE：基于DirectShow架构的专业级开源媒体播放解决方案【免费下载链接】MPC-BE MPC-BE – универсальный проигрыватель аудио и видеофайлов для операционной системы Windows. 项目地址:…

2026/5/26 19:57:06 阅读更多

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南

如何快速计算3D模型体积和重量：STL-Volume-Model-Calculator终极指南【免费下载链接】STL-Volume-Model-Calculator STL Volume Model Calculator Python 项目地址: https://gitcode.com/gh_mirrors/st/STL-Volume-Model-Calculator 你是否曾经为3D打印项目…

2026/5/26 15:11:34 阅读更多

通过Taotoken CLI工具一键配置团队开发环境与模型密钥

通过Taotoken CLI工具一键配置团队开发环境与模型密钥 1. CLI工具安装与基本使用 Taotoken提供的CLI工具可通过npm全局安装或直接使用npx运行。对于需要频繁使用CLI的团队，推荐全局安装： npm install -g taotoken/taotoken对于临时使用或项目级配置&a…

2026/5/26 11:18:30 阅读更多

相关文章