elasticsearch hanlp 插件安装操作

elasticsearch hanlp 插件安装操作

下载 hanlp 插件

这里大家根据自己对应的 elasticsearch 版本下载匹配版本的 hanlp 插件,由于 hanlp 及 elasticsearch 各个版本之间差别较大,如果版本不匹配可能导致 hanlp 插件安装失败或者安装之后不可用,这里我们用的 elasticsearch 版本是6.7.1,因此我下载的 hanlp 插件版本也是6.7.1,已经放在了百度网盘,插件地址:

链接:https://pan.baidu.com/s/1jqCgZUrYUqzLl0wTvbRWMA?pwd=fteq

提取码:fteq 有需要的可以去下载。

另外需要其他版本 hanlp 插件的可以去 github 上面下载,下载地址: https://github.com/KennFalcon/elasticsearch-analysis-hanlp/tree/master 通过切换版本选择适合自己当前用的es版本的 hanlp 插件

上传hanlp插件到elasticsearch服务器

这里你可以先把插件的zip包上传到任何一个位置都行,后续再通过 cp 、 mv 命令将文件移动到指定目录下;或者直接上传到目标目录下都是可以的,在上传之前有一个 ES_HOME 的概念,这里需要提前说明一下,对于我的服务器来说, ES_HOME 路径就是 /elk6.7.1/elasticsearch-6.7.1

安装hanlp插件

切换到es对应的插件文件夹 plugins 下,创建 hanlp 文件夹 analysis-hanlp

shell 复制代码
cd ES_HOME/plugins/

mkdir analysis-hanlp

切换到 analysis-hanlp 文件夹下,上传文件 elasticsearch-analysis-hanlp-6.7.1.zip 或者将上面已经上传好的文件通过命令 cp 、 mv 拷贝至 analysis-hanlp 文件夹下

shell 复制代码
cd analysis-hanlp

rz 本地文件地址

解压 hanlp 插件文件 elasticsearch-analysis-hanlp-6.7.1.zip

shell 复制代码
unzip elasticsearch-analysis-hanlp-6.7.1.zip

解压完成之后回到 ES_HOME 下的 config 文件夹下创建 analysis-hanlp 文件夹

shell 复制代码
cd ES_HOME/config/

mkdir analysis-hanlp

切换到 hanlp 插件解压后文件的 config 文件夹中,拷贝 config 文件夹下的文件到 ES_HOME 下的 config 文件夹下的 analysis-hanlp

shell 复制代码
cd ES_HOME/plugins/analysis-hanlp/config

mv ./* ES_HOME/config/analysis-hanlp/

再次切换到ES_HOME下给对应新增文件的目录递归赋予用户及用户属组权限并重启es

shell 复制代码
cd ES_HOME

chown -R es.es plugins/

chown -R es.es config/

# 重新启动es

至此 elasticsearch hanlp 插件的安装就算完成了,在 kibana 上面测试

kibana测试

测试代码如下

shell 复制代码
POST _analyze

{

  "text": "自建底商转为办公自用 为什么不属于销售或者视同销售?",

  "analyzer": "hanlp"

}

测试效果

json 复制代码
{

  "tokens" : [

    {

      "token" : "自建",

      "start_offset" : 0,

      "end_offset" : 2,

      "type" : "l",

      "position" : 0

    },

    {

      "token" : "底商",

      "start_offset" : 2,

      "end_offset" : 4,

      "type" : "nz",

      "position" : 1

    },

    {

      "token" : "转为",

      "start_offset" : 4,

      "end_offset" : 6,

      "type" : "v",

      "position" : 2

    },

    {

      "token" : "办公",

      "start_offset" : 6,

      "end_offset" : 8,

      "type" : "vn",

      "position" : 3

    },

    {

      "token" : "自用",

      "start_offset" : 8,

      "end_offset" : 10,

      "type" : "vn",

      "position" : 4

    },

    {

      "token" : "为什么",

      "start_offset" : 11,

      "end_offset" : 14,

      "type" : "ryv",

      "position" : 5

    },

    {

      "token" : "不",

      "start_offset" : 14,

      "end_offset" : 15,

      "type" : "d",

      "position" : 6

    },

    {

      "token" : "属于",

      "start_offset" : 15,

      "end_offset" : 17,

      "type" : "v",

      "position" : 7

    },

    {

      "token" : "销售",

      "start_offset" : 17,

      "end_offset" : 19,

      "type" : "vn",

      "position" : 8

    },

    {

      "token" : "或者",

      "start_offset" : 19,

      "end_offset" : 21,

      "type" : "c",

      "position" : 9

    },

    {

      "token" : "视同",

      "start_offset" : 21,

      "end_offset" : 23,

      "type" : "n",

      "position" : 10

    },

    {

      "token" : "销售",

      "start_offset" : 23,

      "end_offset" : 25,

      "type" : "vn",

      "position" : 11

    },

    {

      "token" : "?",

      "start_offset" : 25,

      "end_offset" : 26,

      "type" : "w",

      "position" : 12

    }

  ]

}

测试结果效果图如下

到这里整个elasticsearch hanlp插件的安装及测试就算完成了,欢迎大家有问题的讨论哈。

相关推荐
Elasticsearch1 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch2 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
海兰4 天前
离线合同结构化提取与检索:LangExtract + 本地DeepSeek + Elasticsearch 9.x
大数据·elasticsearch·django
yumgpkpm4 天前
AI视频生成:Wan 2.2(阿里通义万相)在华为昇腾下的部署?
人工智能·hadoop·elasticsearch·zookeeper·flink·kafka·cloudera
Sheffield4 天前
如果把ZooKeeper按字面意思比作动物园管理员……
elasticsearch·zookeeper·kafka
嗝屁小孩纸5 天前
ES索引重建(零工具纯脚本执行)
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客5 天前
使用 Jina Embeddings v5 和 Elasticsearch 构建“与你的网站数据聊天”的 agent
大数据·人工智能·elasticsearch·搜索引擎·容器·全文检索·jina
Elastic 中国社区官方博客5 天前
Elastic 公共 roadmap 在此
大数据·elasticsearch·ai·云原生·serverless·全文检索·aws
码云数智-大飞5 天前
像写 SQL 一样搜索:dbVisitor 如何用 MyBatis 范式颠覆 ElasticSearch 开发
sql·elasticsearch·mybatis