【ES】--ES集成自定义分词库

目录

一、相关安装

1、(window单机)elasticsearch安装

Win10下下载ES组件,安装部署如下:JDK1.8、elasticsearch-7.3.2-windows-x86_64。

ElasticSearch下载地址:

https://www.elastic.co/downloads/elasticsearch

下载zip后,解压即可。双击执行bin目录下的elasticsearch.bat

浏览器输入:http://localhost:9200/ 有返回就表明成功。

2、安装Elasticvue插件

安装 Kibana 可能需要大量的磁盘空间及消耗内存。Elasticvue 是用vue开发的Elasticsearch的免费开源图形化操作插件,可以直接在浏览器中搜索和过滤集群数据,支持的功能如下:

集群概览

索引管理

搜索界面

查询接口(REST & API 浏览器)

快照管理

实用程序

3、ik分词器插件

ik分词器下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?page=8

选择和ES相同版本

将下载的安装包在es安装目录下的plugins下新建一个ik文件夹、将文件解压。

再重新启动elasticsearch.bat,对应ik分词器就启动成功。

或者cmd输入命令也可确认安装的分词器有哪些

elasticsearch-plugin list

ik分词器主要有["analyzer": "ik_smart"]、["analyzer": "ik_max_word"]

4、ES集成自定义词库

在...\elasticsearch-7.3.2\plugins\ik\config下找到IKAnalyzer.cfg.xml,并打开,如下添加一个自定义的扩展字典myDict.dic,在这里添加词语,并设置编码格式是UTF-8。

如果是多个自定义词典,就用;拼接。

重启ES,如下表明已经加载了自定义的字典myDict.dic。

相关推荐
百思可瑞教育8 小时前
Git 对象存储:理解底层原理,实现高效排错与存储优化
大数据·git·elasticsearch·搜索引擎
陆小叁18 小时前
基于Flink CDC实现联系人与标签数据实时同步至ES的实践
java·elasticsearch·flink
2501_930104041 天前
GitCode 疑难问题诊疗:全方位指南
大数据·elasticsearch·gitcode
健康平安的活着1 天前
es7.17.x es服务yellow状态的排查&查看节点,分片状态数量
大数据·elasticsearch·搜索引擎
Elasticsearch2 天前
Elastic 的托管 OTLP 端点:为 SRE 提供更简单、可扩展的 OpenTelemetry
elasticsearch
Yusei_05232 天前
迅速掌握Git通用指令
大数据·git·elasticsearch
水无痕simon3 天前
5 索引的操作
数据库·elasticsearch
Qlittleboy4 天前
tp5集成elasticsearch笔记
大数据·笔记·elasticsearch
Elasticsearch5 天前
Elasticsearch:使用 Gradio 来创建一个简单的 RAG 应用界面
elasticsearch
kong@react5 天前
spring boot配置es
spring boot·后端·elasticsearch