ES使用ik分词器查看分词结果及自定义词汇

本文使用ES版本:elasticsearch-7.17.9

对应Kibana版本也是7.17.9

1、查看es分词结果

在Kibana的dev tools中使用命令查看:

智能分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_smart",
  "text": "1号线,2号线"
}

细粒度分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "1号线,2号线"
}

2、扩展词库、自定义词库

找到es的IK插件位置:

\elasticsearch-7.17.9\plugins\ik\config

打开IKAnalyzer.cfg.xml文件

添加自定义扩展文件

<!--用户可以在这里配置自己的扩展字典 -->

<entry key="ext_dict">my.dic</entry>

同时,在同级目录新建my.dic文件,加入自定义词汇,例如:

1号线

2号线

.......

保存,重启ES即可生效。

注意:自定义的词库只有在使用ik_smart分词才会起作用。

相关推荐
希艾席帝恩30 分钟前
数字孪生如何重塑现代制造体系?
大数据·人工智能·数字孪生·数据可视化·数字化转型
武汉海翎光电33 分钟前
从数据采集到智能决策:船舶传感器的技术跃迁之路
大数据·人工智能
下海fallsea1 小时前
美团没打赢的仗
大数据
无代码专家2 小时前
无代码:打破技术桎梏,重构企业数字化落地新范式
大数据·人工智能·重构
usrcnusrcn2 小时前
告别PoE管理盲区:有人物联网工业交换机如何以智能供电驱动工业未来
大数据·网络·人工智能·物联网·自动化
一缕猫毛3 小时前
Flink demo代码
java·大数据·flink
Hello.Reader3 小时前
Flink ML 基本概念Table API、Stage、Pipeline 与 Graph
大数据·python·flink
pale_moonlight3 小时前
十一、Flink基础环境实战
大数据·flink
beijingliushao3 小时前
103-Spark之Standalone环境测试
大数据·ajax·spark
西格电力科技3 小时前
光伏四可“可观”功能:光伏电站全景数字化的底层支撑技术
大数据·人工智能·架构·能源