ES使用ik分词器查看分词结果及自定义词汇

本文使用ES版本:elasticsearch-7.17.9

对应Kibana版本也是7.17.9

1、查看es分词结果

在Kibana的dev tools中使用命令查看:

智能分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_smart",
  "text": "1号线,2号线"
}

细粒度分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "1号线,2号线"
}

2、扩展词库、自定义词库

找到es的IK插件位置:

\elasticsearch-7.17.9\plugins\ik\config

打开IKAnalyzer.cfg.xml文件

添加自定义扩展文件

<!--用户可以在这里配置自己的扩展字典 -->

<entry key="ext_dict">my.dic</entry>

同时,在同级目录新建my.dic文件,加入自定义词汇,例如:

1号线

2号线

.......

保存,重启ES即可生效。

注意:自定义的词库只有在使用ik_smart分词才会起作用。

相关推荐
财经资讯数据_灵砚智能7 小时前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
Justice Young8 小时前
Flink第六章:flink中的时间和窗口
大数据·flink
xingyuzhisuan8 小时前
算力租赁平台 GPU 资源隔离方案:显存抢占问题深度排查与解决
大数据·云计算·gpu算力
天天讯通9 小时前
OKCC 呼叫中心安全性能全解析:技术防护与管理措施指南
大数据·开发语言·网络·人工智能·安全·语音识别
名不经传的养虾人11 小时前
从0到1:企业级AI项目迭代日记 Vol.47|从“能说”到“能上手”
大数据·人工智能·ai编程·企业ai·多agent协作
MicroTech202511 小时前
业绩披露|微算法科技(MLGO)2025年净利润1.27亿元
大数据·人工智能·科技
AGIPlayer11 小时前
没有生态的大模型不算前沿
大数据·人工智能·物联网
weilaieqi112 小时前
际连集团:印尼公司注册代办一站式服务
大数据
林间码客12 小时前
04 ROC曲线与AUC:从零开始手动计算
大数据·人工智能·算法
穆利堂-movno112 小时前
住宅、写字楼、高校、医院物业后勤数字化升级:“收费+巡检+工单”全链路落地思路
大数据