ES使用ik分词器查看分词结果及自定义词汇

本文使用ES版本:elasticsearch-7.17.9

对应Kibana版本也是7.17.9

1、查看es分词结果

在Kibana的dev tools中使用命令查看:

智能分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_smart",
  "text": "1号线,2号线"
}

细粒度分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "1号线,2号线"
}

2、扩展词库、自定义词库

找到es的IK插件位置:

\elasticsearch-7.17.9\plugins\ik\config

打开IKAnalyzer.cfg.xml文件

添加自定义扩展文件

<!--用户可以在这里配置自己的扩展字典 -->

<entry key="ext_dict">my.dic</entry>

同时,在同级目录新建my.dic文件,加入自定义词汇,例如:

1号线

2号线

.......

保存,重启ES即可生效。

注意:自定义的词库只有在使用ik_smart分词才会起作用。

相关推荐
亿信华辰软件12 小时前
已经上了数据中台,还要做数据治理吗?
大数据·人工智能·数据治理
阿拉伯柠檬12 小时前
Git原理与使用(一)
大数据·linux·git·elasticsearch·面试
亿信华辰软件12 小时前
药企客商域主数据管理实践与挑战
大数据
snpgroupcn12 小时前
技术实战|出海企业收并购中SAP实施商选型与系统整合策略
大数据
远方160913 小时前
113-Oracle database26ai rpm安装和适配生产
大数据·数据库·sql·oracle·database
AC赳赳老秦13 小时前
等保2.0合规实践:DeepSeek辅助企业数据分类分级与自动化报告生成
大数据·人工智能·分类·数据挖掘·自动化·数据库架构·deepseek
视界先声13 小时前
从步态分析到康复医学:青瞳视觉(CHINGMU)如何用高精度动捕解读人体“运动密码”
大数据
猴哥聊项目管理13 小时前
2026年免费项目管理工具,支持任务分配+甘特图+协作 推荐
大数据·数据库·甘特图·项目管理工具·项目管理软件·免费项目管理软件·研发项目管理软件
Hello.Reader13 小时前
Apache Flink 网络 Buffer 调优Debloating 的边界、Buffer 生命周期
大数据·flink·apache
Hello.Reader13 小时前
Apache Flink 内存故障排查从 IllegalConfigurationException 到 OOMKilled,一篇把坑踩平的指南
大数据·flink·apache