PostgreSQL 安装中文全文检索插件zhparser扩展

背景

RAG系统中,单一检索方式有局限:

  • 向量搜索 :理解语义,但可能遗漏精确关键词匹配
  • 关键词搜索 :精确匹配,但无法理解语义
    混合搜索 结合两者优势,提升检索准确率。

所以在 PostgreSQL 中安装 zhparser 扩展,主要是为了解决中文分词的问题(因为 PostgreSQL 原生按空格分词,不适合中文)。

安装过程分为两步:先安装底层的分词库 SCWS,再安装 PostgreSQL 插件 zhparser

以下是基于 Linux (Ubuntu/Debian) 系统的详细安装步骤:


1. 安装依赖

首先确保系统中有编译工具和 PostgreSQL 服务端开发文件。如果没有查看

PostgreSQL 向量扩展插件pgvector安装


2. 安装 SCWS (中文分词库)

zhparser 依赖于 SCWS 库来执行实际的分词工作。

复制代码
cd /tmp
# 下载并解压 (请检查官网是否有更新版本)
wget https://github.com/hightman/scws/archive/refs/tags/1.2.3.tar.gz
tar -zxvf 1.2.3.tar.gz
cd scws-1.2.3

# 编译安装
./configure --prefix=/usr/local
make && sudo make install

3. 安装 zhparser 插件

复制代码
cd /tmp
git clone https://github.com/amutu/zhparser.git
cd zhparser

# 编译安装 (指定SCWS的安装路径)
# 如果configure报错,需要先运行 ./autogen.sh
make SCWS_HOME=/usr/local
make install SCWS_HOME=/usr/local

如果咩有git报错如下

出现 -bash: git: command not found 错误,说明你的 Linux 系统中没有安装 git 工具。

执行命令解决

复制代码
yum install git
验证安装是否成功
git --version

4. 在 PostgreSQL 数据库中启用

切换到 postgres 用户,在目标数据库中创建扩展。

在 SQL 交互界面中执行:

复制代码
-- 创建扩展
CREATE EXTENSION zhparser;

-- 1. 创建文本搜索配置,命名为 'zhparser',并指定使用 zhparser 解析器
CREATE TEXT SEARCH CONFIGURATION zhparser (PARSER = zhparser);

-- 2. 配置词性映射(告诉数据库哪些词性需要被索引)
-- 这里的 'simple' 是 PostgreSQL 内置的词典,负责处理(通常是转小写和去停用词)
ALTER TEXT SEARCH CONFIGURATION zhparser 
ADD MAPPING FOR n,v,a,i,e,l,j WITH simple;

测试如下

相关推荐
神秘的猪头6 分钟前
🚀 React 开发者进阶:RAG 核心——手把手带你玩转 Milvus 向量数据库
数据库·后端·llm
IvorySQL18 小时前
PostgreSQL 技术日报 (3月6日)|为什么 Ctrl-C 在 psql 里让人不安?
数据库·postgresql·开源
NineData19 小时前
数据库管理工具NineData,一年进化成为数万+开发者的首选数据库工具?
运维·数据结构·数据库
IvorySQL1 天前
PostgreSQL 技术日报 (3月5日)|规划器控制力升级,内核能力再进阶
数据库·postgresql·开源
数据组小组2 天前
免费数据库管理工具深度横评:NineData 社区版、Bytebase 社区版、Archery,2026 年开发者该选哪个?
数据库·测试·数据库管理工具·数据复制·迁移工具·ninedata社区版·naivicat平替
悟空聊架构2 天前
基于KaiwuDB在游乐场“刷卡+投币”双模消费系统中的落地实践
数据库·后端·架构
IvorySQL2 天前
PostgreSQL 技术日报 (3月4日)|硬核干货 + 内核暗流一网打尽
数据库·postgresql·开源
进击的丸子2 天前
虹软人脸服务器版SDK(Linux/ARM Pro)多线程调用及性能优化
linux·数据库·后端
NineData3 天前
NineData智能数据管理平台新功能发布|2026年1-2月
数据库·sql·数据分析