分布式搜索-elaticsearch基础 安装es

这里是在虚拟机的Linux系统里安装es的教程:

1.创建网络

在Finashell终端输入指令

docker network create es-net

2.将es.tar安装包放入tmp的目录下

输入指令加载镜像:docker load -i es.tar

3.再运行docker 命令

docker run -d \
	--name es \
    -e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
    -e "discovery.type=single-node" \
    -v es-data:/usr/share/elasticsearch/data \
    -v es-plugins:/usr/share/elasticsearch/plugins \
    --privileged \
    --network es-net \
    -p 9200:9200 \
    -p 9300:9300 \
elasticsearch:7.12.1

命令成功后输入:docker ps 可以看到容器已经运行起来了

4.在主机通过映射地址可以访问到:这里是你虚拟机地址:9200

192.168.221.131:9200

这里是在虚拟机的Linux系统里安装kibana:

1.将kibana安装包放入tmp目录下

2.docker load -i kibana.tart 通过这个指令加载镜像

3.运行容器

docker run -d \
--name kibana \
-e ELASTICSEARCH_HOSTS=http://es:9200 \
--network=es-net \
-p 5601:5601  \
kibana:7.12.1

运行成功后在主机的映射地址可以访问提供的图形化界面:

在这个图形化界面里可以编写dsl语句发送给es。

非常的好用

分词器:

练习:可以看出来默认的standard分词效果并不是很好

POST /_analyze
{
  "analyzer": "standard",
  "text": "黑马程序员学习java太棒了"
}

IK分词器:

这个分词器真好用

IK分词器包含两种模式:

  • ik_smart:最少切分

  • ik_max_word:最细切分

ik_smart模式测试:

ik_max_smart测试

:感觉还是有少许缺陷

IK分词器安装:

1.在线安装:

进入容器内部

docker exec -it elasticsearch /bin/bash

在线下载并安装

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

#退出

exit

#重启容器

docker restart elasticsearch

2.离线安装:

前提:前边加载elasticsearch镜像时候设置了数据卷挂载,有ik的安装包(我有安装包需要的可以私信我拿)。

1.输入命令查看挂载的数据卷路径:

docker volume inspect es-plugins

2.进入路径后把ik安装包拖进去:

3.重启容器:

docker restart es

IK分词器自定义词典:

1.在哪里配置:

在ik文件config目录里边的xml文件。

在这里更改配置:

停用字典
扩展词字典
XML 复制代码
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
	<comment>IK Analyzer 扩展配置</comment>
	<!--用户可以在这里配置自己的扩展字典 -->
    # 这里的ext.dic是文件名名字 可以在该文件同目录的地方创建添加 这里可以自定义
	<entry key="ext_dict">ext.dic</entry>
	 <!--用户可以在这里配置自己的扩展停止词字典-->
	<entry key="ext_stopwords">stopword.dic</entry>
	<!--用户可以在这里配置远程扩展字典 -->
	<!-- <entry key="remote_ext_dict">words_location</entry> -->
	<!--用户可以在这里配置远程扩展停止词字典-->
	<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

这里边的所有dic后缀的文件都是词典,可以自己创建并且config配置,可以点开看一下里边的配置格式,这个还是挺简单的。

这是我新创的dic 并且在配置文件里边指定了

2.测试:

这里看测试结果发现传智播客和李不存已经可以分词分出来了,非常的好用!

3.ik分词器总结:

相关推荐
喝醉酒的小白15 分钟前
Elasticsearch相关知识@1
大数据·elasticsearch·搜索引擎
边缘计算社区16 分钟前
首个!艾灵参编的工业边缘计算国家标准正式发布
大数据·人工智能·边缘计算
MZWeiei16 分钟前
Zookeeper的选举机制
大数据·分布式·zookeeper
MZWeiei16 分钟前
Zookeeper基本命令解析
大数据·linux·运维·服务器·zookeeper
学计算机的睿智大学生17 分钟前
Hadoop集群搭建
大数据·hadoop·分布式
小小工匠2 小时前
ElasticSearch - 深入解析 Elasticsearch Composite Aggregation 的分页与去重机制
elasticsearch·composite·after_key·桶聚合分页
风_流沙2 小时前
java 对ElasticSearch数据库操作封装工具类(对你是否适用嘞)
java·数据库·elasticsearch
szxinmai主板定制专家2 小时前
【国产NI替代】基于FPGA的32通道(24bits)高精度终端采集核心板卡
大数据·人工智能·fpga开发
TGB-Earnest4 小时前
【py脚本+logstash+es实现自动化检测工具】
大数据·elasticsearch·自动化