目录
[三、Docker 安装](#三、Docker 安装)
[3.1 在/opt 里新建一个es7文件夹,然后可以手动建一个data文件夹,也可以不见(因为命令会帮我们自动创建)](#3.1 在/opt 里新建一个es7文件夹,然后可以手动建一个data文件夹,也可以不见(因为命令会帮我们自动创建))
[4.1 新建一个索引](#4.1 新建一个索引)
[4.2 安装分词器:一定要和你的es版本对应(否则报错)](#4.2 安装分词器:一定要和你的es版本对应(否则报错))
一、什么是EelasticSearch
Elasticsearch 是一个开源、分布式、RESTful 风格的搜索引擎和分析引擎,基于 Apache Lucene 构建而成。它提供近实时搜索、数据分析以及海量数据的集中存储能力。Elasticsearch 可横向扩展,支持 PB 级别的结构化和非结构化数据处理,并且具有高可用性、容错性和易于管理等特性,常用于日志分析、监控系统、全文检索等领域。通过其 JSON API 和 Kibana 可视化工具,用户能够快速查询、聚合和可视化数据。
二、安装客户端UI工具,google浏览器
需要翻墙
如果不会翻墙,使用Edge浏览器下载插件
三、Docker 安装
3.1 在/opt 里新建一个es7文件夹,然后可以手动建一个data文件夹,也可以不见(因为命令会帮我们自动创建)
docker run -d --name es7 -e ES_JAVA_POTS="-Xms256m -Xmx256m" -e "discovery.type=single-node" -v /opt/es7/data/:/usr/share/elasticsearch/data -p 9200:9200 -p 9300:9300 elasticsearch:7.14.0
如果报错了,就是权限不足,我们给目录放开权限即可。
友情提示,如果安装成功后使用docker ps 查不到,需要先使用docker pa -a ,找到该镜像的id,然乎使用dockers restart id名即可。
四、打开安装好的客户端工具
4.1 新建一个索引
点击测试后如果链接错误,可能是命令那行256m太大了,你的宿主机没这么大的内存,调小一下就行了
4.2 安装分词器:一定要和你的es版本对应(否则报错)
在 Elasticsearch 的 IK Analyzer 中,ik_smart 和 ik_max_word 是IK 分词器针对中文分词提供的两种策略,但分词效果和粒度不同:
ik_smart: 这种模式更侧重于保持语义完整性,尽量进行较少的、更有意义的拆分,减少无意义的子词组合,提高搜索准确率,降低误报率。
示例:"中华人民共和国人民大会堂" 分词结果(ik_smart)可能只有:"中华人民共和国"、"人民大会堂"等较完整、更具实际意义的词语组合。
ik_max_word: 此模式致力于最大化地拆分文本,即尽可能多地生成可能的词语组合,包括单字、双字直至整个短语。它的特点是尽力穷举所有可能的词汇,提高召回率,但在某些情况下可能会造成噪声较多。
示例:"中华人民共和国人民大会堂" 分词结果(ik_max_word)可能包括:中华人民共和国、中华人民、中华、华人、人民共和国、人民、共和国、大会堂、大会、会堂等。
简单来说,ik_max_word
更倾向于全面细致的分词,而 ik_smart
则偏向于精简和精准的分词。在实际应用场景中,选择哪种模式取决于项目的具体需求,如是否需要扩大搜索覆盖面还是提高搜索准确性。
官网:https://github.com/medcl/elasticsearch-analysis-ik/releases
#第一步 copy 插件到容器
docker cp /opt/es7/elasticsearch-analysis-ik-7.14.0.zip 容器id:/usr/share/elasticsearch
#第二步进入你的容器
docker exec -it 容器id /bin/bash
#第三步执行如下命令,安装插件,中间会提示 Y or N,直接写 Y ,回车即可
elasticsearch-plugin install file:\/usr/share/elasticsearch/elasticsearch-analysis-ik-7.14.0.zip
#第四步退出容器
exit
#第五步重启容器
docker restart 容器ID
4.3 测试分词器
post _analyze
{
"analyzer": "ik_smart",
"text": "大学生自习室视频爆火鼻祖"
}