ES使用ik分词器查看分词结果及自定义词汇

本文使用ES版本:elasticsearch-7.17.9

对应Kibana版本也是7.17.9

1、查看es分词结果

在Kibana的dev tools中使用命令查看:

智能分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_smart",
  "text": "1号线,2号线"
}

细粒度分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "1号线,2号线"
}

2、扩展词库、自定义词库

找到es的IK插件位置:

\elasticsearch-7.17.9\plugins\ik\config

打开IKAnalyzer.cfg.xml文件

添加自定义扩展文件

<!--用户可以在这里配置自己的扩展字典 -->

<entry key="ext_dict">my.dic</entry>

同时,在同级目录新建my.dic文件,加入自定义词汇,例如:

1号线

2号线

.......

保存,重启ES即可生效。

注意:自定义的词库只有在使用ik_smart分词才会起作用。

相关推荐
九河云几秒前
共享出行数字化转型:车辆调度 AI 优化与用户体验数据化迭代实践
大数据·人工智能·安全·数字化转型
搞科研的小刘选手2 分钟前
【人工智能专题】第五届人工智能与大数据国际学术研讨会 (AIBDF 2025)
大数据·人工智能·数据分析·学术会议·核心算法
红队it2 分钟前
【Spark+Hive】基于Spark大数据旅游景点数据分析可视化推荐系统(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
大数据·python·算法·数据分析·spark·django·echarts
触想工业平板电脑一体机22 分钟前
【触想智能】工业触控一体机在工业应用中扮演的角色以及其应用场景分析
android·大数据·运维·电脑·智能电视
TDengine (老段)24 分钟前
TDengine 统计函数 STDDEV_SAMP 用户手册
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
cui178756825 分钟前
重构消费模式:消费增值如何让 “花出去的钱” 回头找你?
大数据·人工智能·设计模式·重构·运维开发
yunson_Liu28 分钟前
记一次Elasticsearch cpu负载过高解决全过程
elasticsearch
原神启动128 分钟前
云计算大数据——MySQL数据库二(数据库管理)
大数据·数据库·mysql
一辉ComeOn41 分钟前
【大数据高并发核心场景实战】缓存层 - 写缓存
java·大数据·redis·缓存
Blossom.11842 分钟前
基于扩散模型的视频生成优化:从Stable Diffusion到AnimateDiff的显存革命
人工智能·深度学习·学习·决策树·搜索引擎·stable diffusion·音视频