微服务——elasticsearch

初识ES------什么是elasticsearch

elasticsearch的发展

初识ES------正向索引和倒排索引

初识ES------es与mysql的概念对比

类比到mysql中是表结构约束

概念对比

初始ES------安装es和kibana

1.部署单点es

1.1创建网络

要安装es容器和kibana容器并让他们之间相连,这里就要先创建一个网络

复制代码
docker network create es-net

1.2拉取es镜像

复制代码
docker pull elasticsearch:7.12.1

1.3运行

复制代码
docker run -d \
	--name es \
    -e "ES_JAVA_OPTS=-Xms512m -Xmx512m" \
    -e "discovery.type=single-node" \
    -v es-data:/usr/share/elasticsearch/data \
    -v es-plugins:/usr/share/elasticsearch/plugins \
    --privileged \
    --network es-net \
    -p 9200:9200 \
    -p 9300:9300 \
elasticsearch:7.12.1

docker run -d 	--name es      -e "ES_JAVA_OPTS=-Xms512m -Xmx512m"     -e "discovery.type=single-node"      -v es-data:/usr/share/elasticsearch/data      -v es-plugins:/usr/share/elasticsearch/plugins      --privileged      --network es-net      -p 9200:9200      -p 9300:9300  elasticsearch:7.12.1

命令解释:

  • -e "cluster.name=es-docker-cluster":设置集群名称

  • -e "http.host=0.0.0.0":监听的地址,可以外网访问

  • -e "ES_JAVA_OPTS=-Xms512m -Xmx512m":内存大小

  • -e "discovery.type=single-node":非集群模式

  • -v es-data:/usr/share/elasticsearch/data:挂载逻辑卷,绑定es的数据目录

  • -v es-logs:/usr/share/elasticsearch/logs:挂载逻辑卷,绑定es的日志目录

  • -v es-plugins:/usr/share/elasticsearch/plugins:挂载逻辑卷,绑定es的插件目录

  • --privileged:授予逻辑卷访问权

  • --network es-net :加入一个名为es-net的网络中

  • -p 9200:9200:端口映射配置

在浏览器中输入:http://xxx.xxx.xxx.xxx:9200/ 即可看到elasticsearch的响应结果:

2.部署kibana

kibana可以给我们提供一个elasticsearch的可视化界面,便于我们学习。

2.1.拉取镜像

复制代码
docker pull kibana:7.12.1

2.2部署

复制代码
docker run -d \
--name kibana \
-e ELASTICSEARCH_HOSTS=http://es:9200 \
--network=es-net \
-p 5601:5601  \
kibana:7.12.1
  • --network es-net :加入一个名为es-net的网络中,与elasticsearch在同一个网络中

  • -e ELASTICSEARCH_HOSTS=http://es:9200":设置elasticsearch的地址,因为kibana已经与elasticsearch在一个网络,因此可以用容器名直接访问elasticsearch

  • -p 5601:5601:端口映射配置

此时,在浏览器输入地址访问:http://xxx.xxx.xxx.xxx:5601,即可看到结果

2.2.DevTools

kibana中提供了一个DevTools界面:

如果一直是这个界面的话说明苟日的内存炸了.....tmd,不就是开了个nacos,rabbitmq,redis,然后就顶不住了es+kibana

正常进来之后如下

进入DevTools

下面的DSL命令就是查询es中的所有数据,

模拟发送一个GET请求,和上面的es:9200得到的东西一样。

初始ES------安装IK分词器

如下所见对中文的分词支持不友好,完全逐字来分

一般中文分词用的是IK分词器

在线安装ik插件

java 复制代码
# 进入容器内部
docker exec -it elasticsearch /bin/bash

# 在线下载并安装
./bin/elasticsearch-plugin  install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip

#退出
exit
#重启容器
docker restart elasticsearch

IK分词器包含两种模式:

  • ik_smart:最少切分

  • ik_max_word:最细切分

java 复制代码
GET /_analyze
{
  "analyzer": "ik_max_word",
  "text": "北岭山脚鼠鼠学习java"
}

再次测试得到如下结果,

java 复制代码
{
  "tokens" : [
    {
      "token" : "北",
      "start_offset" : 0,
      "end_offset" : 1,
      "type" : "CN_CHAR",
      "position" : 0
    },
    {
      "token" : "岭",
      "start_offset" : 1,
      "end_offset" : 2,
      "type" : "CN_CHAR",
      "position" : 1
    },
    {
      "token" : "山脚",
      "start_offset" : 2,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "鼠",
      "start_offset" : 4,
      "end_offset" : 5,
      "type" : "CN_CHAR",
      "position" : 3
    },
    {
      "token" : "鼠",
      "start_offset" : 5,
      "end_offset" : 6,
      "type" : "CN_CHAR",
      "position" : 4
    },
    {
      "token" : "学习",
      "start_offset" : 6,
      "end_offset" : 8,
      "type" : "CN_WORD",
      "position" : 5
    },
    {
      "token" : "java",
      "start_offset" : 8,
      "end_offset" : 12,
      "type" : "ENGLISH",
      "position" : 6
    }
  ]
}

IK分词器的扩展和停用词典

在IK分词器的底层会依赖一个词典,比如一些网络用语组成的词语。什么鸡你太美。。。

新建一个 ext.dic,可以参考config目录下复制一个配置文件进行修改

java 复制代码
奥力给
北岭山
北岭山脚鼠鼠

在 stopword.dic 添加停用词

java 复制代码
蔡徐坤

重启elasticsearch

java 复制代码
# 重启服务
docker restart elasticsearch
docker restart kibana
相关推荐
海兰32 分钟前
Elasticsearch 9.x 本地RAG个人知识库实操
大数据·elasticsearch·搜索引擎
lizhongxuan5 小时前
AI 系统架构
架构
普通网友7 小时前
Android Jetpack 架构组件最佳实践之“网抑云”APP
android·架构·android jetpack
Elastic 中国社区官方博客9 小时前
使用 Elastic 进行网络监控:统一网络可观测性
大数据·开发语言·网络·人工智能·elasticsearch·搜索引擎·全文检索
海兰10 小时前
Elasticsearch 9.x 借助神经模型优化中文文本分析
大数据·elasticsearch·搜索引擎
海兰11 小时前
ES9.x 银行场景:银行卡可疑交易风控工作流示例
java·elasticsearch·搜索引擎
礼拜天没时间.12 小时前
JumpServer堡垒机部署与实战:从0到1搭建统一运维入口
linux·运维·架构·堡垒机·jumpserver·sre
智算菩萨14 小时前
人工智能智能体研究综述:从理论架构到前沿应用
人工智能·机器学习·架构
古城小栈15 小时前
后端视角:拆解春晚背后的高可用技术架构
后端·架构
海兰17 小时前
ES 9.3.0 DSL 示例:从索引创建到混合搜索与 RRF 排序
大数据·数据库·elasticsearch