elasticsearch hanlp 插件安装操作

elasticsearch hanlp 插件安装操作

下载 hanlp 插件

这里大家根据自己对应的 elasticsearch 版本下载匹配版本的 hanlp 插件,由于 hanlp 及 elasticsearch 各个版本之间差别较大,如果版本不匹配可能导致 hanlp 插件安装失败或者安装之后不可用,这里我们用的 elasticsearch 版本是6.7.1,因此我下载的 hanlp 插件版本也是6.7.1,已经放在了百度网盘,插件地址:

链接:https://pan.baidu.com/s/1jqCgZUrYUqzLl0wTvbRWMA?pwd=fteq

提取码:fteq 有需要的可以去下载。

另外需要其他版本 hanlp 插件的可以去 github 上面下载,下载地址: https://github.com/KennFalcon/elasticsearch-analysis-hanlp/tree/master 通过切换版本选择适合自己当前用的es版本的 hanlp 插件

上传hanlp插件到elasticsearch服务器

这里你可以先把插件的zip包上传到任何一个位置都行,后续再通过 cp 、 mv 命令将文件移动到指定目录下;或者直接上传到目标目录下都是可以的,在上传之前有一个 ES_HOME 的概念,这里需要提前说明一下,对于我的服务器来说, ES_HOME 路径就是 /elk6.7.1/elasticsearch-6.7.1

安装hanlp插件

切换到es对应的插件文件夹 plugins 下,创建 hanlp 文件夹 analysis-hanlp

shell 复制代码
cd ES_HOME/plugins/

mkdir analysis-hanlp

切换到 analysis-hanlp 文件夹下,上传文件 elasticsearch-analysis-hanlp-6.7.1.zip 或者将上面已经上传好的文件通过命令 cp 、 mv 拷贝至 analysis-hanlp 文件夹下

shell 复制代码
cd analysis-hanlp

rz 本地文件地址

解压 hanlp 插件文件 elasticsearch-analysis-hanlp-6.7.1.zip

shell 复制代码
unzip elasticsearch-analysis-hanlp-6.7.1.zip

解压完成之后回到 ES_HOME 下的 config 文件夹下创建 analysis-hanlp 文件夹

shell 复制代码
cd ES_HOME/config/

mkdir analysis-hanlp

切换到 hanlp 插件解压后文件的 config 文件夹中,拷贝 config 文件夹下的文件到 ES_HOME 下的 config 文件夹下的 analysis-hanlp

shell 复制代码
cd ES_HOME/plugins/analysis-hanlp/config

mv ./* ES_HOME/config/analysis-hanlp/

再次切换到ES_HOME下给对应新增文件的目录递归赋予用户及用户属组权限并重启es

shell 复制代码
cd ES_HOME

chown -R es.es plugins/

chown -R es.es config/

# 重新启动es

至此 elasticsearch hanlp 插件的安装就算完成了,在 kibana 上面测试

kibana测试

测试代码如下

shell 复制代码
POST _analyze

{

  "text": "自建底商转为办公自用 为什么不属于销售或者视同销售?",

  "analyzer": "hanlp"

}

测试效果

json 复制代码
{

  "tokens" : [

    {

      "token" : "自建",

      "start_offset" : 0,

      "end_offset" : 2,

      "type" : "l",

      "position" : 0

    },

    {

      "token" : "底商",

      "start_offset" : 2,

      "end_offset" : 4,

      "type" : "nz",

      "position" : 1

    },

    {

      "token" : "转为",

      "start_offset" : 4,

      "end_offset" : 6,

      "type" : "v",

      "position" : 2

    },

    {

      "token" : "办公",

      "start_offset" : 6,

      "end_offset" : 8,

      "type" : "vn",

      "position" : 3

    },

    {

      "token" : "自用",

      "start_offset" : 8,

      "end_offset" : 10,

      "type" : "vn",

      "position" : 4

    },

    {

      "token" : "为什么",

      "start_offset" : 11,

      "end_offset" : 14,

      "type" : "ryv",

      "position" : 5

    },

    {

      "token" : "不",

      "start_offset" : 14,

      "end_offset" : 15,

      "type" : "d",

      "position" : 6

    },

    {

      "token" : "属于",

      "start_offset" : 15,

      "end_offset" : 17,

      "type" : "v",

      "position" : 7

    },

    {

      "token" : "销售",

      "start_offset" : 17,

      "end_offset" : 19,

      "type" : "vn",

      "position" : 8

    },

    {

      "token" : "或者",

      "start_offset" : 19,

      "end_offset" : 21,

      "type" : "c",

      "position" : 9

    },

    {

      "token" : "视同",

      "start_offset" : 21,

      "end_offset" : 23,

      "type" : "n",

      "position" : 10

    },

    {

      "token" : "销售",

      "start_offset" : 23,

      "end_offset" : 25,

      "type" : "vn",

      "position" : 11

    },

    {

      "token" : "?",

      "start_offset" : 25,

      "end_offset" : 26,

      "type" : "w",

      "position" : 12

    }

  ]

}

测试结果效果图如下

到这里整个elasticsearch hanlp插件的安装及测试就算完成了,欢迎大家有问题的讨论哈。

相关推荐
筱源源41 分钟前
Elasticsearch-linux环境部署
linux·elasticsearch
Elastic 中国社区官方博客11 小时前
释放专利力量:Patently 如何利用向量搜索和 NLP 简化协作
大数据·数据库·人工智能·elasticsearch·搜索引擎·自然语言处理
Shenqi Lotus18 小时前
ELK-ELK基本概念_ElasticSearch的配置
elk·elasticsearch
yeye1989122419 小时前
10-Query & Filtering 与多字符串多字段查询
elasticsearch
Narutolxy1 天前
精准优化Elasticsearch:磁盘空间管理与性能提升技巧20241106
大数据·elasticsearch·jenkins
谢小涛2 天前
ES管理工具Cerebro 0.8.5 Windows版本安装及启动
elasticsearch·es·cerebro
LKID体2 天前
Elasticsearch核心概念
大数据·elasticsearch·搜索引擎
晨欣2 天前
Elasticsearch里的索引index是什么概念?(ChatGPT回答)
大数据·elasticsearch·jenkins
许苑向上2 天前
最详细【Elasticsearch】Elasticsearch Java API + Spring Boot集成 实战入门(基础篇)
java·数据库·spring boot·elasticsearch
三世2 天前
Jupyter notebook 添加目录插件
jupyter·插件·目录·notebook