ES使用ik分词器查看分词结果及自定义词汇

本文使用ES版本:elasticsearch-7.17.9

对应Kibana版本也是7.17.9

1、查看es分词结果

在Kibana的dev tools中使用命令查看:

智能分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_smart",
  "text": "1号线,2号线"
}

细粒度分词器--

Scala 复制代码
GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "1号线,2号线"
}

2、扩展词库、自定义词库

找到es的IK插件位置:

\elasticsearch-7.17.9\plugins\ik\config

打开IKAnalyzer.cfg.xml文件

添加自定义扩展文件

<!--用户可以在这里配置自己的扩展字典 -->

<entry key="ext_dict">my.dic</entry>

同时,在同级目录新建my.dic文件,加入自定义词汇,例如:

1号线

2号线

.......

保存,重启ES即可生效。

注意:自定义的词库只有在使用ik_smart分词才会起作用。

相关推荐
laocooon52385788619 小时前
大专Hadoop课程考试方案设计
大数据·hadoop·分布式
是阿威啊19 小时前
【用户行为归因分析项目】- 【企业级项目开发第五站】数据采集并加载到hive表
大数据·数据仓库·hive·hadoop·spark·scala
sunxunyong19 小时前
hadoop平台问题总结
大数据
禾黍黎19 小时前
ElasticSearch+Logstash 对 数据库数据进行转换和检索
大数据·数据库·elasticsearch
小北方城市网19 小时前
GEO 元宇宙协同与自主进化治理实战:构建全域自治的智能地理生态
大数据·人工智能·microsoft·知识图谱·数据库架构·geo
电商API&Tina19 小时前
跨境电商高并发 API 接口接入指南(技术落地 + 高可用优化)
大数据·服务器·前端·数据库·python·json
万邦科技Lafite19 小时前
淘宝商品SKU规格信息获取指南及item_skuAPI开放接口详解
java·大数据·数据库·mysql·电商开放平台·淘宝开放平台
青鱼入云19 小时前
详细介绍下Elasticsearch 布尔查询
大数据·elasticsearch·搜索引擎
云雾J视界19 小时前
知识管理4.0时代:大模型与知识图谱如何重构企业智库与决策体系
搜索引擎·llm·知识图谱·知识管理·seci模型·智能增强
四月天0319 小时前
Flink在金融行业实时计算应用
大数据·人工智能