ES学习日记(八)-------ik安装和简易使用

一、下载和安装

https://github.com/infinilabs/analysis-ik.git

网络不好可以用这个地址,注意:ik版本要和es版本保持一致

现成地址

注意es用户操作或给es用户权限

plugins新建ik文件夹,并把压缩包解压到ik

java 复制代码
unzip elasticsearch-analysis-ik-7.4.2.zip

/bin目录启动es:

二、简易使用

1.新建索引

打开head,新建索引ik

没有安装head的同学也可以直接敲命令创建索引(分片数5,副本数1),

java 复制代码
curl -X PUT http://localhost:9200/ik -H 'Content-Type:application/json' -d'{
	"settings":{
		"number_of_shards":5
		"number_of_replicas": 1
	}
}'
2.创建索引映射

映射:可以理解为mysql里面的字段,字段有varchar、double、bigint等;

常见类型有text(可以做分词)、keyword(关键词,无法分词)double、integer

官方解释如下图:

命令

java 复制代码
curl -XPOST http://localhost:9200/ik/_mapping -H 'Content-Type:application/json' -d'{
	"properties":{
		"content":{
			"type": "text",
			"analyzer":"ik_max_word",
			"search_analyzer":"ik_smart"
		}
	}
}'

Analyzer分词配置解释:

·ik smart:粗粒度分词,比如中华人民共和国国歌,会拆分为中华人民共和国,国歌,

ik max_word:细粒度分词,比如中华人民共和国国歌,会拆分为中华人民共和国,中华人民,中华,华人人民共和国,人民,人,民,共和国,共和,和,国国,国歌,会穷尽各种可能的组合。

3.添加数据

示例数据:

java 复制代码
curl -XPOST http://localhost:9200/ik/_create/1 -H 'Content-Type:application/json' -d'{"content":"美国留给伊拉克的是个烂摊子吗"}'
curl -XPOST http://localhost:9200/ik/_create/2 -H 'Content-Type:application/json' -d'{"content":"公安部:各地校车将享最高路权"}'
curl -XPOST http://localhost:9200/ik/_create/3 -H 'Content-Type:application/json' -d'{"content":"中韩渔警冲突调查:韩警平均每天扣1艘中国渔船"}'
curl -XPOST http://localhost:9200/ik/_create/4 -H 'Content-Type:application/json' -d'{"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}'

执行结果:不要关注过程,过程不重要...

打开head,切换索引ik,点击搜索查看刚才插入的数据

4.查询

没有head的同学用命令:

java 复制代码
curl -XGET http://localhost:9200/ik/_search?pretty -H 'Content-Type:application/json' -d'{
	"query": {
		"term" :{
			"content" : "中国"
			}
		}
}'

高亮查询,看标签,命令应该没问题

java 复制代码
curl -XGET http://localhost:9200/ik/_search?pretty -H 'Content-Type:application/json' -d'
{
	"query" : { "match" : { "content" :"中国"}},
	"highlight" :{
		"pre_tags" :["<font color=red>" ],
		"post_tags" :["</font>"],
		"fields" :{
			"content" :{}
		}
	}
}'

写在最后

ik分词器有自己的分词规则,比如我拿刚才数据,搜"中"的结果

所以,这个分词,不是说有这个字,我就能分到,是有自己的规则的,是在添加数据时,按照规则进行分词,不是他的词,分不出来也搜不到,这点注意一下。

好了,这就是ik中文分词器,其实不需要做太多,就把分词器放到plugins里面启动,然后设置mapping,试着analyzer就可以了。

相关推荐
Elasticsearch3 小时前
如何通过 Claude Code 来写入 CSV 数据到 Elasticsearch
elasticsearch
得物技术1 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子1 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据
大树882 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
通信小呆呆2 天前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
大志哥1232 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
H__Rick2 天前
自动对焦学习-3
人工智能·学习·计算机视觉
Daisy Lee2 天前
量化学习-第1章-什么是量化金融
学习·金融·datawhale
Alsn862 天前
等待学习-学习目录:Docker 容器安全攻防
学习·安全·docker
果丁智能2 天前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居