postgresql中文分词插件安装

1.SCWS

要使用 zhparser,首先需要安装 SCWS 分词库,SCWS 是 Simple Chinese Word Segmentation 的首字母缩写(即:简易中文分词系统)GitHub

http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2

./configure 
make install

2.Zhparser

GitHub - amutu/zhparser: zhparser is a PostgreSQL extension for full-text search of Chinese language

 make && make install
遇到:pgxs.mk: 没有那个文件或目录,安装postgres-devel包
找不到pg_config:可以指定PG_CONFG=/usr/pgsql-14/bin/pg_config make

3.postgresql中文检索配置

登录postgresql启用zhparser插件

create extension zhparser;

创建使用zhparser作为解析器的全文搜索的配置

-- 就是需要给zhparser解析器取一个在sql里面可以使用的名称,一下"zh"则为名称 CREATE create text search configuration chinese (parser=zhparser);

添加token映射

alter text search configuration chinese add mapping for a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z with simple;

4、全文检索使用

索引创建

create index idx_name on table_name using gin(to_tsvector('zh', field_name));

查询

SELECT * FROM table_name WHERE to_tsvector('zh', field_name) @@ 'keyword';

相关推荐
Kai HVZ6 小时前
《深度学习》——自然语言处理(NLP)
人工智能·深度学习·自然语言处理
North_D9 小时前
ML.NET库学习008:使用ML.NET进行心脏疾病预测模型开发
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·数据挖掘
没枕头我咋睡觉11 小时前
【大语言模型_2】mindie部署deepseek模型
人工智能·语言模型·自然语言处理
仙人掌_lz11 小时前
【再读】2501.12948/DeepSeek-R1通过强化学习提升大型语言模型(LLMs)的推理能力
人工智能·语言模型·自然语言处理
tangjunjun-owen12 小时前
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step论文解读
人工智能·语言模型·自然语言处理·llava-cot论文
FserSuN14 小时前
大语言模型Agent
人工智能·语言模型·自然语言处理
真上帝的左手15 小时前
23. AI-大语言模型-DeepSeek赋能开发-Spring AI集成
spring boot·ai·语言模型·自然语言处理·ai编程
过期动态16 小时前
【DeepSeek服务器部署全攻略】Linux服务器部署DeepSeek R1模型、实现API调用、搭建Web页面以及专属知识库
linux·服务器·人工智能·深度学习·机器学习·自然语言处理
North_D18 小时前
ML.NET库学习011:基于YOLO目标检测算法的图像处理系统
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·数据挖掘
Archie_IT19 小时前
DeepSeek模型快速部署教程-搭建自己的DeepSeek
人工智能·深度学习·神经网络·计算机视觉·自然语言处理·数据挖掘·语音识别