elasticsearch hanlp 插件安装操作

elasticsearch hanlp 插件安装操作

下载 hanlp 插件

这里大家根据自己对应的 elasticsearch 版本下载匹配版本的 hanlp 插件,由于 hanlp 及 elasticsearch 各个版本之间差别较大,如果版本不匹配可能导致 hanlp 插件安装失败或者安装之后不可用,这里我们用的 elasticsearch 版本是6.7.1,因此我下载的 hanlp 插件版本也是6.7.1,已经放在了百度网盘,插件地址:

链接:https://pan.baidu.com/s/1jqCgZUrYUqzLl0wTvbRWMA?pwd=fteq

提取码:fteq 有需要的可以去下载。

另外需要其他版本 hanlp 插件的可以去 github 上面下载,下载地址: https://github.com/KennFalcon/elasticsearch-analysis-hanlp/tree/master 通过切换版本选择适合自己当前用的es版本的 hanlp 插件

上传hanlp插件到elasticsearch服务器

这里你可以先把插件的zip包上传到任何一个位置都行,后续再通过 cp 、 mv 命令将文件移动到指定目录下;或者直接上传到目标目录下都是可以的,在上传之前有一个 ES_HOME 的概念,这里需要提前说明一下,对于我的服务器来说, ES_HOME 路径就是 /elk6.7.1/elasticsearch-6.7.1

安装hanlp插件

切换到es对应的插件文件夹 plugins 下,创建 hanlp 文件夹 analysis-hanlp

shell 复制代码
cd ES_HOME/plugins/

mkdir analysis-hanlp

切换到 analysis-hanlp 文件夹下,上传文件 elasticsearch-analysis-hanlp-6.7.1.zip 或者将上面已经上传好的文件通过命令 cp 、 mv 拷贝至 analysis-hanlp 文件夹下

shell 复制代码
cd analysis-hanlp

rz 本地文件地址

解压 hanlp 插件文件 elasticsearch-analysis-hanlp-6.7.1.zip

shell 复制代码
unzip elasticsearch-analysis-hanlp-6.7.1.zip

解压完成之后回到 ES_HOME 下的 config 文件夹下创建 analysis-hanlp 文件夹

shell 复制代码
cd ES_HOME/config/

mkdir analysis-hanlp

切换到 hanlp 插件解压后文件的 config 文件夹中,拷贝 config 文件夹下的文件到 ES_HOME 下的 config 文件夹下的 analysis-hanlp

shell 复制代码
cd ES_HOME/plugins/analysis-hanlp/config

mv ./* ES_HOME/config/analysis-hanlp/

再次切换到ES_HOME下给对应新增文件的目录递归赋予用户及用户属组权限并重启es

shell 复制代码
cd ES_HOME

chown -R es.es plugins/

chown -R es.es config/

# 重新启动es

至此 elasticsearch hanlp 插件的安装就算完成了,在 kibana 上面测试

kibana测试

测试代码如下

shell 复制代码
POST _analyze

{

  "text": "自建底商转为办公自用 为什么不属于销售或者视同销售?",

  "analyzer": "hanlp"

}

测试效果

json 复制代码
{

  "tokens" : [

    {

      "token" : "自建",

      "start_offset" : 0,

      "end_offset" : 2,

      "type" : "l",

      "position" : 0

    },

    {

      "token" : "底商",

      "start_offset" : 2,

      "end_offset" : 4,

      "type" : "nz",

      "position" : 1

    },

    {

      "token" : "转为",

      "start_offset" : 4,

      "end_offset" : 6,

      "type" : "v",

      "position" : 2

    },

    {

      "token" : "办公",

      "start_offset" : 6,

      "end_offset" : 8,

      "type" : "vn",

      "position" : 3

    },

    {

      "token" : "自用",

      "start_offset" : 8,

      "end_offset" : 10,

      "type" : "vn",

      "position" : 4

    },

    {

      "token" : "为什么",

      "start_offset" : 11,

      "end_offset" : 14,

      "type" : "ryv",

      "position" : 5

    },

    {

      "token" : "不",

      "start_offset" : 14,

      "end_offset" : 15,

      "type" : "d",

      "position" : 6

    },

    {

      "token" : "属于",

      "start_offset" : 15,

      "end_offset" : 17,

      "type" : "v",

      "position" : 7

    },

    {

      "token" : "销售",

      "start_offset" : 17,

      "end_offset" : 19,

      "type" : "vn",

      "position" : 8

    },

    {

      "token" : "或者",

      "start_offset" : 19,

      "end_offset" : 21,

      "type" : "c",

      "position" : 9

    },

    {

      "token" : "视同",

      "start_offset" : 21,

      "end_offset" : 23,

      "type" : "n",

      "position" : 10

    },

    {

      "token" : "销售",

      "start_offset" : 23,

      "end_offset" : 25,

      "type" : "vn",

      "position" : 11

    },

    {

      "token" : "?",

      "start_offset" : 25,

      "end_offset" : 26,

      "type" : "w",

      "position" : 12

    }

  ]

}

测试结果效果图如下

到这里整个elasticsearch hanlp插件的安装及测试就算完成了,欢迎大家有问题的讨论哈。

相关推荐
Dusk_橙子9 小时前
在elasticsearch中,document数据的写入流程如何?
大数据·elasticsearch·搜索引擎
喝醉酒的小白11 小时前
Elasticsearch 中,分片(Shards)数量上限?副本的数量?
大数据·elasticsearch·jenkins
熟透的蜗牛14 小时前
Elasticsearch 8.17.1 JAVA工具类
elasticsearch
九圣残炎18 小时前
【ElasticSearch】 Java API Client 7.17文档
java·elasticsearch·搜索引擎
risc12345620 小时前
【Elasticsearch】HNSW
elasticsearch
我的棉裤丢了21 小时前
windows安装ES
大数据·elasticsearch·搜索引擎
乙卯年QAQ1 天前
【Elasticsearch】RestClient操作文档
java·大数据·elasticsearch·jenkins
超级阿飞1 天前
利用Kubespray安装生产环境的k8s集群-实施篇
elasticsearch·容器·kubernetes
小诺大人2 天前
Docker 安装 elk(elasticsearch、logstash、kibana)、ES安装ik分词器
elk·elasticsearch·docker
装疯迷窍_A2 天前
ARCGIS国土超级工具集1.3更新说明
arcgis·c#·插件·变更调查·尖锐角·狭长