pgvector：在 Postgres 里直接做向量检索

发布时间：2026/6/8 14:27:54

文章目录pgvector在 Postgres 里直接做向量检索1、它能干什么2、两种索引按需选3、过滤查询和混合搜索4、数据怎么存怎么扩5、安装和上手6、适合谁用pgvector在 Postgres 里直接做向量检索pgvector 在 GitHub 上已经拿到 21,579 Star。它是个 Postgres 扩展做的事情很明确把向量数据和高维相似度检索直接塞进 Postgres 里。不用额外起服务不用导数据建表、插向量、查近邻全部用 SQL 搞定。1、它能干什么向量检索是 RAG 和推荐系统的核心环节。传统做法是把向量往专门的向量数据库里塞业务数据留在 Postgres两边各管各的查个近邻还得跨服务。pgvector 把这层拆掉了。向量列和普通列一样建在表上近邻查询写成 SQL还能 JOIN、WHERE、GROUP BY 一起用。它支持的向量类型覆盖常见场景单精度浮点向量vector最高 2,000 维半精度浮点向量halfvec最高 4,000 维省一半存储二进制向量bit最高 64,000 维适合量化加速稀疏向量sparsevec最高 1,000 个非零元素距离函数也有六种L2 距离、内积、余弦距离、L1 距离、Hamming 距离、Jaccard 距离。OpenAI 的文本嵌入直接就能用内积查。2、两种索引按需选精确搜索逐行算距离结果准确但数据量大时慢。pgvector 提供两种近似索引在速度和召回率之间取舍。HNSW是多层图索引查询性能高构建慢内存占用大。不需要先有数据就能建没有训练步骤。CREATEINDEXONitemsUSINGhnsw(embedding vector_l2_ops);IVFFlat把向量分到若干列表里只搜离查询向量最近的那几列表。构建更快内存更少查询性能不如 HNSW。CREATEINDEXONitemsUSINGivfflat(embedding vector_l2_ops)WITH(lists100);建索引时调maintenance_work_mem能显著缩短构建时间。大批量写入数据时先导入再建索引顺序不要反。3、过滤查询和混合搜索带条件的近邻搜索很常见。比如只搜某个分类下的向量或者距离小于某个阈值的结果。pgvector 的做法是在过滤列上建普通索引近邻查询和条件查询一起走。如果过滤条件命中行数少精确搜索加 Btree 索引就够快。条件命中行数多可以用近似索引配合迭代扫描自动扫更多索引直到结果够数。SEThnsw.iterative_scanstrict_order;它还能和 Postgres 的全文检索混搭做混合搜索。语义相似度和关键词匹配各自跑再用 RRF 或交叉编码器融合结果。这一套组合不需要引入新的存储组件。4、数据怎么存怎么扩向量量化的思路是用低精度或二进制向量建索引做粗筛原始向量留在表里做精排。pgvector 支持二进制量化表达式索引查的时候先走 Hamming 距离召回 Top 20再用原始向量的余弦距离精排取 Top 5。SELECT*FROM(SELECT*FROMitemsORDERBYbinary_quantize(embedding)::bit(3)~binary_quantize([1,-2,3])LIMIT20)ORDERBYembedding[1,-2,3]LIMIT5;半精度向量也是类似的思路存储和索引都用halfvec查询时类型转换一下省空间又省内存。子向量索引支持把高维向量拆成低维段分别建索引适合跨模态检索里不同维度的特征分离场景。5、安装和上手编译安装支持 Postgres 13Linux 和 Mac 上就是三板斧gitclone--branchv0.8.2 pgvector.gitcdpgvectormakemakeinstallWindows 用nmake编译。Docker、Homebrew、PGXN、APT、Yum、conda-forge 这些渠道也都有包Postgres.app 还预装了。数据库里启用扩展CREATEEXTENSION vector;建表插数据CREATETABLEitems(id bigserialPRIMARYKEY,embedding vector(3));INSERTINTOitems(embedding)VALUES([1,2,3]),([4,5,6]);查近邻SELECT*FROMitemsORDERBYembedding-[3,1,2]LIMIT5;-是 L2 距离#是内积是余弦距离。语法和 Postgres 原生查询没有区别。6、适合谁用已经用 Postgres 做业务数据库、不想为向量单独起一套存储的团队pgvector 是最省事的方案。数据一致性、备份恢复、权限管理全部复用 Postgres 的机制不需要额外维护一条链路。做 RAG 系统的开发者也能直接复用向量库和业务库在一个实例里JOIN 和事务都天然支持。向量量化和子向量索引给的扩展路径足够撑到十亿级别向量的场景。Postgres 的机制不需要额外维护一条链路。做 RAG 系统的开发者也能直接复用向量库和业务库在一个实例里JOIN 和事务都天然支持。向量量化和子向量索引给的扩展路径足够撑到十亿级别向量的场景。

汽车LIN总线温度显示节点设计：从硬件选型到低功耗实现

1. 项目概述在汽车电子系统里，线束的复杂度和成本一直是工程师们头疼的问题。想象一下，一个车门模块要控制车窗、后视镜、门锁，还要读取温度传感器，如果每个功能都用独立的线缆连接到车身控制器，那线束会变得又粗又重&…

2026/6/8 14:27:14 阅读更多

Adobe Illustrator批量替换神器：ReplaceItems.jsx终极指南 - 3分钟学会批量设计替换

Adobe Illustrator批量替换神器：ReplaceItems.jsx终极指南 - 3分钟学会批量设计替换【免费下载链接】illustrator-scripts Adobe Illustrator scripts 项目地址: https://gitcode.com/gh_mirrors/il/illustrator-scripts 还在为Illustrator中繁琐的重复修改…

2026/6/8 14:27:13 阅读更多

终极指南：让Apple触控板在Windows上实现原生级精准操作

终极指南：让Apple触控板在Windows上实现原生级精准操作【免费下载链接】mac-precision-touchpad Windows Precision Touchpad Driver Implementation for Apple MacBook / Magic Trackpad 项目地址: https://gitcode.com/gh_mirrors/ma/mac-precision-touchpad …

2026/6/8 14:26:11 阅读更多

从Modbus仿真器到真实设备：手把手调试C#写入报文（避坑线圈/寄存器反转）

从Modbus仿真器到真实设备：手把手调试C#写入报文（避坑线圈/寄存器反转）在工业自动化领域，Modbus协议因其简单可靠的特点，成为连接PLC、传感器等设备的事实标准。然而，许多C#开发者都会遇到这样的困境&#…

2026/6/8 15:18:35 阅读更多

fre:ac音频转换器：5分钟掌握免费开源的音频处理神器

fre:ac音频转换器：5分钟掌握免费开源的音频处理神器【免费下载链接】freac The fre:ac audio converter project 项目地址: https://gitcode.com/gh_mirrors/fr/freac 还在为音频格式转换而烦恼吗？想找到一款真正免费、功能全面的音频处理工具吗…

2026/6/8 15:18:35 阅读更多

MC68HC908MR32无感BLDC电机控制：参数配置与PC Master软件调优实战

1. 项目概述与核心挑战无刷直流（BLDC）电机以其高效率、高扭矩密度和长寿命等优点，在工业自动化、消费电子和汽车领域得到了广泛应用。然而，其控制的核心难点在于精确的换相时序。对于无位置传感器（Sensorless&#xff…

2026/6/8 15:18:35 阅读更多

linux系统使用的一些问题

Linux系统使用的一些问题ThinkBook14(2025版)在Ubuntu24系统不能使用触摸板ThinkBook14(2025版)在Ubuntu24系统不能使用触摸板解决方法： 给 libinput 增加一个本地设备特例规则，让 Ubuntu 24.04 把你的 ThinkBook 14 触摸板识别为 pressure pad / Forc…

2026/6/8 15:17:54 阅读更多

当AutoHotkey遇见Chrome DevTools：告别Selenium的浏览器自动化新选择

当AutoHotkey遇见Chrome DevTools：告别Selenium的浏览器自动化新选择【免费下载链接】Chrome.ahk Automate Google Chrome using native AutoHotkey 项目地址: https://gitcode.com/gh_mirrors/ch/Chrome.ahk 你是否曾为浏览器自动化任务的繁琐配置而头疼&a…

2026/6/8 15:17:54 阅读更多

终极指南：如何用AutoHotkey实现Chrome浏览器自动化控制

终极指南：如何用AutoHotkey实现Chrome浏览器自动化控制【免费下载链接】Chrome.ahk Automate Google Chrome using native AutoHotkey 项目地址: https://gitcode.com/gh_mirrors/ch/Chrome.ahk 想要摆脱重复的网页操作？厌倦了手动点击和填写表单…

2026/6/8 15:17:13 阅读更多

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现【免费下载链接】amlogic-s9xxx-armbian Supports running Armbian on Amlogic, Allwinner, and Rockchip devices. Support a311d, s922x, s905x3, s905x2, s912, s905d, s905x, …

2026/6/8 0:00:25 阅读更多

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

前言在 Python 爬虫开发领域中，Scrapy 作为高性能、高可扩展性的异步爬虫框架，是行业内采集结构化数据的首选工具。在中小型爬虫项目、本地数据采集、轻量化数据存储场景中，SQLite 无需独立服务、单文件存储、原生兼容 Python 的特性&#…

2026/6/8 0:00:45 阅读更多

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 还在为Windows无法访问Linux Btrfs分区而烦恼吗？你是…

2026/6/8 0:03:08 阅读更多

LED驱动技术全解析：从核心架构到实战选型与避坑指南

1. 从一颗灯珠到千亿市场：LED驱动的技术演进与商业逻辑十几年前，当我第一次从料盘上拿起一颗0603封装的白色LED时，它微弱的光晕和高达几块钱的单颗成本，让我很难想象今天它几乎照亮了我们生活的每一个角落。从手机屏幕的一抹背光&…

2026/6/8 0:06:11 阅读更多

索引堆及其优化

索引堆及其优化引言索引堆是一种数据结构，广泛应用于计算机科学和软件工程领域。它主要用于解决优先队列问题，如最小堆和最大堆。本文将详细介绍索引堆的概念、实现方法以及优化策略。索引堆的定义索引堆是一种基于堆数据结构的索引机制。它通过维护一个堆来存储数据…

2026/6/8 0:06:11 阅读更多

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

更多请点击： https://intelliparadigm.com 第一章：CSDN AI 数字营销的官方引流卡片是什么功能？ CSDN AI 数字营销平台推出的「官方引流卡片」，是一种面向技术创作者的轻量级、可嵌入式内容分发组件，专为提升博文、教程…

2026/6/8 0:06:11 阅读更多

Zotero Duplicates Merger：5步彻底清理文献库重复条目

Zotero Duplicates Merger：5步彻底清理文献库重复条目【免费下载链接】ZoteroDuplicatesMerger A zotero plugin to automatically merge duplicate items 项目地址: https://gitcode.com/gh_mirrors/zo/ZoteroDuplicatesMerger 还在为文献库中堆积如山的重…

2026/6/8 9:43:25 阅读更多

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

2026/6/8 9:43:23 阅读更多

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因

更多请点击： https://intelliparadigm.com 第一章：为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因 Gemini邮件的客户转化效率（CTE）显著偏低，根本原因常被误判为…

2026/6/8 9:43:30 阅读更多

相关文章

汽车LIN总线温度显示节点设计：从硬件选型到低功耗实现

Adobe Illustrator批量替换神器：ReplaceItems.jsx终极指南 - 3分钟学会批量设计替换

终极指南：让Apple触控板在Windows上实现原生级精准操作

从Modbus仿真器到真实设备：手把手调试C#写入报文（避坑线圈/寄存器反转）

fre:ac音频转换器：5分钟掌握免费开源的音频处理神器

MC68HC908MR32无感BLDC电机控制：参数配置与PC Master软件调优实战

linux系统使用的一些问题

当AutoHotkey遇见Chrome DevTools：告别Selenium的浏览器自动化新选择

终极指南：如何用AutoHotkey实现Chrome浏览器自动化控制

解决老旧机顶盒资源化难题：Amlogic S9xxx Armbian项目在TY1608设备上的系统适配实现

Python Scrapy 爬虫实战进阶系列（一）：轻量化数据存储 - 数据精准写入 SQLite 数据库

3步实现Windows直读Btrfs分区：跨平台文件系统互通终极方案

LED驱动技术全解析：从核心架构到实战选型与避坑指南

索引堆及其优化

从零到日增237精准粉丝，我靠CSDN这张AI卡片爆了！手把手复刻全流程，含配置避坑清单

Zotero Duplicates Merger：5步彻底清理文献库重复条目

利用随机有限集理论对蜂群的ILQR和MPC控制研究附Matlab代码

为什么你的Gemini邮件CTE低于行业均值2.8倍？：从Prompt架构到发送时序的深度归因