【ES】--ES集成热更新自定义词库(字典)

目录

一、问题描述

问题现象 :

前面完成了自定义分词器词库集成到ES中。在实际项目中词库是时刻在变更的,但又不希望重启ES,对此我们应该如何解决?
解决方案

针对上面的问题,可以采用**"自定义热更新词库"方案:使用Tomcat来实现热更新**。

二、具体实施

1、Tomcat实现远程扩展字典

Win10下安装部署Tomcat,在**\webapps\ROOT路径下,创建一个hotDict.dic文件。文件内容就是自定义的词库,如下:

启动\bin下的startup.bat

到此,浏览器输入http://localhost:8080/hotDict.dic。有数据表明正常启动。

【说明:即使手动更新hotDict.dic文件内容,也不需要重启Tomcat!】

2、验证生效

knowledge_customize.link_info.value设置了["analyzer": "ik_max_word"]。

这里先输入"追梦少年",ik分词器分词效果是

把"追命少年"加入hotDict.dic文件中,不需要重启Tomcat和ES,等待一分钟左右时间。

最新的效果是

3、ES配置远程扩展字典

打开**\plugins\ik\config路径下IKAnalyzer.cfg.xml文件

重启ES,会加载这些自定义字典。

4、为何不重启ES能实现热更新

Es-ik插件的源码中

相关推荐
Elasticsearch2 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch3 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
海兰4 天前
离线合同结构化提取与检索:LangExtract + 本地DeepSeek + Elasticsearch 9.x
大数据·elasticsearch·django
yumgpkpm5 天前
AI视频生成:Wan 2.2(阿里通义万相)在华为昇腾下的部署?
人工智能·hadoop·elasticsearch·zookeeper·flink·kafka·cloudera
Sheffield5 天前
如果把ZooKeeper按字面意思比作动物园管理员……
elasticsearch·zookeeper·kafka
嗝屁小孩纸5 天前
ES索引重建(零工具纯脚本执行)
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客5 天前
使用 Jina Embeddings v5 和 Elasticsearch 构建“与你的网站数据聊天”的 agent
大数据·人工智能·elasticsearch·搜索引擎·容器·全文检索·jina
Elastic 中国社区官方博客5 天前
Elastic 公共 roadmap 在此
大数据·elasticsearch·ai·云原生·serverless·全文检索·aws
码云数智-大飞5 天前
像写 SQL 一样搜索:dbVisitor 如何用 MyBatis 范式颠覆 ElasticSearch 开发
sql·elasticsearch·mybatis