【ES】--ES集成自定义分词库

目录

一、相关安装

1、(window单机)elasticsearch安装

Win10下下载ES组件,安装部署如下:JDK1.8、elasticsearch-7.3.2-windows-x86_64。

ElasticSearch下载地址:

https://www.elastic.co/downloads/elasticsearch

下载zip后,解压即可。双击执行bin目录下的elasticsearch.bat

浏览器输入:http://localhost:9200/ 有返回就表明成功。

2、安装Elasticvue插件

安装 Kibana 可能需要大量的磁盘空间及消耗内存。Elasticvue 是用vue开发的Elasticsearch的免费开源图形化操作插件,可以直接在浏览器中搜索和过滤集群数据,支持的功能如下:

集群概览

索引管理

搜索界面

查询接口(REST & API 浏览器)

快照管理

实用程序

3、ik分词器插件

ik分词器下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases?page=8

选择和ES相同版本

将下载的安装包在es安装目录下的plugins下新建一个ik文件夹、将文件解压。

再重新启动elasticsearch.bat,对应ik分词器就启动成功。

或者cmd输入命令也可确认安装的分词器有哪些

elasticsearch-plugin list

ik分词器主要有["analyzer": "ik_smart"]、["analyzer": "ik_max_word"]

4、ES集成自定义词库

在...\elasticsearch-7.3.2\plugins\ik\config下找到IKAnalyzer.cfg.xml,并打开,如下添加一个自定义的扩展字典myDict.dic,在这里添加词语,并设置编码格式是UTF-8。

如果是多个自定义词典,就用;拼接。

重启ES,如下表明已经加载了自定义的字典myDict.dic。

相关推荐
老纪的技术唠嗑局17 小时前
告别OpenClaw配置丢失——Mindkeeper内测版邀测
大数据·elasticsearch·搜索引擎
Elasticsearch17 小时前
使用 Elasticsearch + Jina embeddings 进行无监督文档聚类
elasticsearch
勇哥的编程江湖19 小时前
flinkcdc streaming 同步数据到es记录过程
大数据·elasticsearch·flink·flinkcdc
曾阿伦19 小时前
Elasticsearch 7.x 常用命令备忘录
大数据·elasticsearch·搜索引擎
斯特凡今天也很帅20 小时前
Elasticsearch数据库专栏(二)DSL语句总结(更新中)
大数据·elasticsearch·搜索引擎
要记得喝水20 小时前
适用于 Git Bash 的脚本,批量提交和推送多个仓库的修改
git·elasticsearch·bash
二十七剑21 小时前
Elasticsearch的索引问题
大数据·elasticsearch·搜索引擎
A__tao1 天前
Elasticsearch Mapping 一键生成 Java 实体类(支持嵌套 + 自动过滤注释)
java·python·elasticsearch
A__tao1 天前
Elasticsearch Mapping 一键生成 Proto 文件(支持嵌套 + 注释过滤)
大数据·elasticsearch·jenkins
Devin~Y1 天前
高并发电商与AI智能客服场景下的Java面试实战:从Spring Boot到RAG与向量数据库落地
java·spring boot·redis·elasticsearch·spring cloud·kafka·rag