news 2026/4/23 15:56:06

3分钟掌握pgvector:让PostgreSQL拥有向量搜索超能力

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
3分钟掌握pgvector:让PostgreSQL拥有向量搜索超能力

3分钟掌握pgvector:让PostgreSQL拥有向量搜索超能力

【免费下载链接】pgvectorOpen-source vector similarity search for Postgres项目地址: https://gitcode.com/GitHub_Trending/pg/pgvector

想要在PostgreSQL数据库中直接进行向量相似性搜索吗?pgvector正是你需要的开源扩展,它让PostgreSQL具备了专业的向量搜索能力,支持精确和近似最近邻搜索,完美融入你的数据生态系统。

读完本文,你将了解pgvector的核心功能、安装方法和实用场景,快速上手这个强大的向量搜索工具。

什么是pgvector?

pgvector是一个开源的PostgreSQL扩展,专门为向量相似性搜索而生。它支持:

  • 单精度、半精度、二进制和稀疏向量存储
  • 多种距离度量:L2距离、内积、余弦距离、L1距离、汉明距离和杰卡德距离
  • 跨语言兼容:任何支持PostgreSQL客户端的编程语言

更棒的是,pgvector继承了PostgreSQL的所有优秀特性:ACID合规性、时间点恢复、JOIN操作等。

快速安装指南

Linux和Mac系统

cd /tmp git clone --branch v0.8.1 https://gitcode.com/GitHub_Trending/pg/pgvector cd pgvector make sudo make install

Windows系统

确保已安装Visual Studio的C++支持,然后以管理员身份运行"x64 Native Tools Command Prompt":

set "PGROOT=C:\Program Files\PostgreSQL\18" cd %TEMP% git clone --branch v0.8.1 https://gitcode.com/GitHub_Trending/pg/pgvector cd pgvector nmake /F Makefile.win nmake /F Makefile.win install

核心功能实战

创建向量表

启用扩展并创建包含向量列的表:

-- 启用扩展(每个数据库只需执行一次) CREATE EXTENSION vector; -- 创建带3维向量列的表 CREATE TABLE items (id bigserial PRIMARY KEY, embedding vector(3));

插入向量数据

INSERT INTO items (embedding) VALUES ('[1,2,3]'), ('[4,5,6]');

执行相似性搜索

-- 使用L2距离查找最近邻 SELECT * FROM items ORDER BY embedding <-> '[3,1,2]' LIMIT 5;

pgvector支持多种距离操作符:

  • <->L2距离(欧几里得距离)
  • <#>负内积
  • <=>余弦距离
  • <+>L1距离(曼哈顿距离)

索引优化策略

HNSW索引:速度与精度的平衡

HNSW索引构建多层图结构,在查询性能上优于IVFFlat,但构建时间较慢且占用更多内存。

-- 为L2距离创建HNSW索引 CREATE INDEX ON items USING hnsw (embedding vector_l2_ops);

HNSW参数调优

  • m:每层最大连接数(默认16)
  • ef_construction:构建图的动态候选列表大小(默认64)

IVFFlat索引:快速构建的选择

IVFFlat索引将向量划分为多个列表,然后搜索最接近查询向量的列表子集。

-- 为L2距离创建IVFFlat索引 CREATE INDEX ON items USING ivfflat (embedding vector_l2_ops) WITH (lists = 100);

IVFFlat使用技巧

  1. 在表有足够数据后创建索引
  2. 选择合适的列表数量
  3. 查询时指定适当的探测数量

高级功能探索

混合搜索:文本+向量

结合PostgreSQL全文搜索实现混合搜索:

SELECT id, content FROM items, plainto_tsquery('搜索词') query WHERE textsearch @@ query ORDER BY ts_rank_cd(textsearch, query) DESC LIMIT 5;

稀疏向量支持

存储和搜索稀疏向量:

CREATE TABLE items (id bigserial PRIMARY KEY, embedding sparsevec(5)); INSERT INTO items (embedding) VALUES ('{1:1,3:2,5:3}/5'), ('{1:4,3:5,5:6}/5'); SELECT * FROM items ORDER BY embedding <-> '{1:3,3:1,5:2}/5' LIMIT 5;

性能优化要点

内存配置

-- 提高维护工作内存以加速索引构建 SET maintenance_work_mem = '8GB';

并行处理

-- 增加并行工作线程数量 SET max_parallel_maintenance_workers = 7;

常见问题解决

索引未被使用?

确保查询包含ORDER BYLIMIT,且ORDER BY必须是距离操作符的结果:

-- 正确:使用索引 ORDER BY embedding <=> '[3,1,2]' LIMIT 5; -- 错误:不使用索引 ORDER BY 1 - (embedding <=> '[3,1,2]') DESC LIMIT 5;

查询结果过少?

对于HNSW索引,增加动态候选列表大小:

SET hnsw.ef_search = 100;

实际应用场景

pgvector在以下场景中表现出色:

  1. 推荐系统:基于用户行为向量寻找相似用户
  2. 图像搜索:基于图像特征向量查找相似图片
  3. 语义搜索:基于文本嵌入向量进行语义相似性匹配
  4. 异常检测:基于模式向量识别异常行为

总结

pgvector为PostgreSQL注入了向量搜索的超能力,让你能够在熟悉的数据库环境中处理复杂的相似性搜索任务。无论是简单的向量存储还是大规模的生产环境,pgvector都能提供稳定可靠的性能。

开始你的向量搜索之旅吧!在PostgreSQL中创建第一个向量表,体验pgvector带来的便利和强大功能。记住,向量搜索不再是专业系统的专利,现在它就在你的PostgreSQL数据库中!

【免费下载链接】pgvectorOpen-source vector similarity search for Postgres项目地址: https://gitcode.com/GitHub_Trending/pg/pgvector

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 14:00:12

Cute_Animal_For_Kids_Qwen_Image HTTPS加密:安全传输部署配置详解

Cute_Animal_For_Kids_Qwen_Image HTTPS加密&#xff1a;安全传输部署配置详解 1. 项目简介与核心价值 你有没有试过&#xff0c;孩子指着手机或平板上的动物图片问“这是什么&#xff1f;”、“它住在哪里&#xff1f;”&#xff0c;而你却只能干巴巴地回答“这是一只小熊”…

作者头像 李华
网站建设 2026/4/23 16:39:19

手把手教你将PaddleOCR-VL集成到Dify:基于MCP协议的AI Agent文档解析实践

手把手教你将PaddleOCR-VL集成到Dify&#xff1a;基于MCP协议的AI Agent文档解析实践 1. 前言&#xff1a;从被动响应到主动感知的Agent进化 在2025年&#xff0c;AI Agent已经不再是“能回答问题的聊天机器人”&#xff0c;而是具备环境感知、工具调用和任务执行能力的数字员…

作者头像 李华
网站建设 2026/4/23 15:25:39

OpenCode终极指南:免费AI编程助手如何提升你的开发效率

OpenCode终极指南&#xff1a;免费AI编程助手如何提升你的开发效率 【免费下载链接】opencode 一个专为终端打造的开源AI编程助手&#xff0c;模型灵活可选&#xff0c;可远程驱动。 项目地址: https://gitcode.com/GitHub_Trending/openc/opencode 在当今快节奏的软件开…

作者头像 李华
网站建设 2026/4/18 17:13:35

AF_XDP技术深度解析:构建下一代高性能网络应用架构

AF_XDP技术深度解析&#xff1a;构建下一代高性能网络应用架构 【免费下载链接】awesome-ebpf A curated list of awesome projects related to eBPF. 项目地址: https://gitcode.com/gh_mirrors/awe/awesome-ebpf 在现代云计算和分布式系统领域&#xff0c;网络性能瓶颈…

作者头像 李华
网站建设 2026/4/18 18:54:38

PaddleOCR-VL-WEB核心优势解析|轻量级VLM赋能文档智能处理

PaddleOCR-VL-WEB核心优势解析&#xff5c;轻量级VLM赋能文档智能处理 1. 引言&#xff1a;为什么我们需要新一代文档解析方案&#xff1f; 在企业日常运营中&#xff0c;每天都会产生大量PDF、扫描件、合同、发票和报告等非结构化文档。传统OCR工具虽然能提取文字&#xff0…

作者头像 李华
网站建设 2026/4/18 12:50:43

5分钟掌握Layui表单组件:新手必看的终极指南

5分钟掌握Layui表单组件&#xff1a;新手必看的终极指南 【免费下载链接】layui 项目地址: https://gitcode.com/gh_mirrors/lay/layui 还在为网页表单的复杂布局和样式烦恼吗&#xff1f;Layui表单组件提供了简洁高效的解决方案&#xff0c;让你快速构建美观实用的表单…

作者头像 李华