Elasticsearch 7.6 安装 Jieba 中文分词插件完整教程

Elasticsearch 7.6 安装 Jieba 中文分词插件完整教程

    • [一. 前置准备](#一. 前置准备)
    • [二. 安装 Gradle](#二. 安装 Gradle)
      • [2.1 下载 Gradle](#2.1 下载 Gradle)
      • [2.2 配置环境变量](#2.2 配置环境变量)
    • [三. 下载 Elasticsearch-jieba 插件源码](#三. 下载 Elasticsearch-jieba 插件源码)
    • [四. 构建插件](#四. 构建插件)
    • [五. 修改插件版本(可选)](#五. 修改插件版本(可选))
    • [六 测试](#六 测试)

前言

这是我在这个网站整理的笔记,有错误的地方请指出,关注我,接下来还会持续更新。

作者:神的孩子都在歌唱

推荐文章:es开源小工具 -- 分析器功能

Elasticsearch 默认的分析器对中文支持不好,jieba 分词插件是最常用的中文分词方案之一。本文将详细介绍在 Elasticsearch 7.6 上安装、构建、使用 jieba 插件的完整流程,包括 Gradle 安装、源码构建、插件安装和使用示例

一. 前置准备

  • 系统:CentOS 7
  • Elasticsearch 版本:7.6.1
  • Java 版本:JDK 8~ 11+
  • 工具:Gradle(用于构建插件)

注意:Elasticsearch 不能以 root 用户运行,需要创建专用用户。

bash 复制代码
sudo useradd -r -s /sbin/nologin elasticsearch

将 Elasticsearch 目录属主改为 elasticsearch 用户:

bash 复制代码
sudo chown -R elasticsearch:elasticsearch /chen/env/elasticsearch-7.6.1

二. 安装 Gradle

Elasticsearch-jieba 插件源码需要 Gradle 构建。由于国内访问 Gradle 官方下载慢,推荐使用 国内镜像

2.1 下载 Gradle

bash 复制代码
cd /tmp
wget https://mirrors.aliyun.com/gradle/gradle-4.10.3-bin.zip
sudo mkdir -p /chen/env/gradle
sudo unzip gradle-4.10.3-bin.zip -d /chen/env/gradle

或者手动下载上传也可以

2.2 配置环境变量

记得修改地址路径

bash 复制代码
echo 'export GRADLE_HOME=/chen/env/gradle/gradle-4.10.3' >> ~/.bashrc
echo 'export PATH=$GRADLE_HOME/bin:$PATH' >> ~/.bashrc
source ~/.bashrc

验证安装:

bash 复制代码
gradle -v

三. 下载 Elasticsearch-jieba 插件源码

使用国内镜像 Gitee 加快下载:

bash 复制代码
cd /root
git clone https://gitee.com/mirrors/elasticsearch-jieba-plugin.git
cd elasticsearch-jieba-plugin
git checkout 7.4.2   # 切换到与 ES 7.6 对应的版本

也可以手动下载:
gitee

github

四. 构建插件

bash 复制代码
gradle pz

构建完成后,会在以下目录 生成 zip 文件:

复制代码
build/distributions/elasticsearch-jieba-plugin-7.6.1.zip

如果报错 Could not get unknown property 'runtime',说明 Gradle 版本过高,需要切换到 4.x 或 5.x。

然后将插件放入es的plugins目录,解压

shell 复制代码
cp elasticsearch-jieba-plugin-7.4.2.zip /chen/env/elasticsearch-7.6.1/plugins/
unzip elasticsearch-jieba-plugin-7.4.2.zip -d analysis-jieba

五. 修改插件版本(可选)

启动时会报 Plugin was built for Elasticsearch version 7.4.2 but 7.6.1 is running

如果遇到插件标注的版本和 ES 不匹配,可修改,博主就遇到了这个问题,所以也是折腾了一会才知道:

bash 复制代码
cd build/distributions/elasticsearch-jieba-plugin-7.6.1
vim plugin-descriptor.properties

修改 elasticsearch.version=7.4.2 为:

复制代码
elasticsearch.version=7.6.1

然后在重启es就可以了

六 测试

安装完成后,重启es,检查插件是否安装成功:

bash 复制代码
curl -X GET "localhost:9200/_cat/plugins?v"

示例输出:

以上结果是我用的我自己的开发的es小工具输出的,大家感兴趣可以去看看,代码完全开源,对日常工作和学习都是挺不错的。完整代码连接 github 对你有帮助记得点赞收藏,es开源小工具 -- 分析器功能

使用结巴分词查询

css 复制代码
{{url}}/_analyze
{
  "analyzer": "jieba_index",
  "text": "你好呀"
}

作者:神的孩子都在歌唱

本人博客:https://blog.csdn.net/weixin_46654114

转载说明:务必注明来源,附带本人博客连接。

相关推荐
weixin_307779133 小时前
Jenkins ASM API 插件:详解与应用指南
java·运维·开发语言·后端·jenkins
是垚不是土4 小时前
轻量化CICD落地:基于Jenkins与Supervisor的中小企业服务发布实践
运维·servlet·ci/cd·微服务·jenkins
hid558845364 小时前
LS-DYNA在爆炸与冲击领域的应用研究:从隧道支护到地下采场爆破模拟
jenkins
Elastic 中国社区官方博客4 小时前
用 Elasticsearch 构建一个 ChatGPT connector 来查询 GitHub issues
大数据·人工智能·elasticsearch·搜索引擎·chatgpt·github·全文检索
武子康4 小时前
大数据-172 Elasticsearch 索引操作与 IK 分词器落地实战:7.3/8.15 全流程速查
大数据·后端·elasticsearch
Elasticsearch5 小时前
Elastic 与 Accenture 在 GenAI 数据准备方面的合作
elasticsearch
Elastic 中国社区官方博客6 小时前
Elasticsearch:在隔离环境中安装 ELSER 模型
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Dxy12393102166 小时前
Elasticsearch删除数据介绍
大数据·elasticsearch·搜索引擎
weixin_307779136 小时前
Jenkins Branch API插件详解:多分支项目管理的核心引擎
java·运维·开发语言·架构·jenkins
泻水置平地6 小时前
Docker下安装ES和kibana详细教程
elasticsearch·docker·容器