ElasticSearch基础用法

什么是ElasticSearch?

Elasticsearch是一个开源的、分布式的、实时的搜索和分析引擎。它允许用户近乎实时地存储、检索大量数据,并能够高效地对其进行全文搜索、聚合和分析。

部署ES和Kibana

通常采用docker-compose部署ES(ElasticSearch)服务是最方便的,这里不得不提到将ES数据可视化的客户端工具kibana。

Kibana是一个开源的数据分析和可视化平台,设计出来主要用于与Elasticsearch一起使用。用户可以用Kibana来搜索、查看和交互存放在Elasticsearch索引中的数据,通过各种不同的图表、表格和地图等来展示高级的数据分析与可视化。

下面我们将这两个服务一起部署, 从dockerhub上获取到es和kibana的docker镜像,下面是docker-compose.yml。

复制代码
version: '3'
services:
  es01:
    image: elasticsearch:7.14.1
    environment:
      - node.name=es01
      - cluster.name=data-cluster
      - bootstrap.memory_lock=true
      - cluster.initial_master_nodes=es01
      - "ES_JAVA_OPTS=-Xms512m -Xmx512m"
    ulimits:
      memlock:
        soft: -1
        hard: -1
    volumes:
      - /data/docker2/elastic/es01/data:/usr/share/elasticsearch/data
      - /data/docker2/elastic/es01/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml
      - /data/docker2/elastic/es01/plugins:/usr/share/elasticsearch/plugins
      - /data/docker2/elastic/es01/logs:/usr/share/elasticsearch/logs
      - /etc/localtime:/etc/localtime
    ports:
      - 9201:9200
    #networks:
    #  - elastic
    restart: always

  kibana:
    image: kibana:7.14.1
    ports:
      - 5602:5601
    environment:
      SERVER_NAME: 10.88.7.123
      ELASTICSEARCH_HOSTS: '["http://10.88.7.123:9201"]'
    restart: always

注意:kibana中的'SERVER_NAME'设置成ES服务的IP地址,'ELASTICSEARCH_HOSTS'设置成ES服务的地址。

镜像和docker-compose.yml准备好后,执行命令创建容器并启动服务。

bash 复制代码
docker-compose up -d --build 

确认ES和kibana服务是否启动成功:

bash 复制代码
# docker-compose ps
           Name                          Command               State                         Ports                      
------------------------------------------------------------------------------------------------------------------------                       
docker2_es01_1                /bin/tini -- /usr/local/bi ...   Up      0.0.0.0:9201->9200/tcp, 9300/tcp                 
docker2_kibana_1              /bin/tini -- /usr/local/bi ...   Up      0.0.0.0:5602->5601/tcp           

浏览器访问kibana,http://{ip地址}:5602 ,如下图:

点击Dev tools进入工具集可以通过指令和ES集群进行交互。

Kibana的Dev Tools提供了多种工具,可以用于执行各种与Elasticsearch相关的操作,例如创建索引、修改映射、运行查询和聚合等。

这些工具使得开发人员和数据分析师能够轻松地与Elasticsearch集群进行交互,执行各种查询和操作,并进行实时分析和可视化。

Kibana Dev-tools中的常用操作指令

1、索引相关
bash 复制代码
# 1、创建索引
PUT /users
{
  "mappings": {
    "properties": {
      "UserName": {
        "type": "text",
        "analyzer": "standard"
      },
      "Department": {
        "type": "keyword"
      },
      "Permissions": {
        "type": "keyword"
      }
    }
  }
}

# 2、删除索引
DELETE /users

# 3、获取集群中所有索引信息
GET /_cat/indices?v

# 4、查询某个索引(users)信息
GET /users/_mapping

# 5、索引增加字段
PUT /users/_mapping
{
  "properties": {
    "new_field": {
      "type": "text"
    }
  }
}
2、文档相关
bash 复制代码
# 1、增加文档
POST /users/_doc
{
  "UserName": "xiaoming",
  "Department": "研发一部",
  "Permissions": [],
  "status": "normal"
}

# 2、删除文档(通过doc的id删除)
DELETE /users/_doc/X3K3SosB8OQmTd26aQgG

# 3、分页查询文档
# 从第21条开始获取,一共获取20条记录;默认from为0,size为10
GET /users/_search
{
  "query": {
    "match_all": {}
  },
  "from": 20,
  "size": 20
}

# 4、修改某个记录的字段值
# <index_name> 是索引名称,<document_type> 是文档类型(如果适用),<document_id> 是要修改的文档的ID。
POST /<index_name>/<document_type>/<document_id>/_update  
{  
  "doc": {  
    "<field_name>": "<new_value>"  
  }  
}

# 5、 查询并删除
# 这里用到符合查询
POST /<index_name>/_delete_by_query
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "<field_name>": "<value>"
          }
        },
        {
          "match": {
           "<field_name2>": "<value2>"
          }
        }
      ]
    }
  }
}

# 6、 搜索并聚类
GET /<index_name>/_search
{
  "size": 0, 
  "query": {
    "match": {
      "<field_name>": "<field_value>"
    }
  },
  "aggs": {
    "group_by_field": {
      "terms": {
        "field": "<要聚类的字段名>",
        "size": <返回的聚类数量>
      }
    }
  }
}
3、其它

Kibana中提供的ES的API指令还有很多,这里不在赘述。大家在使用中有具体需求时可进行在线查找使用,随着各种AI工具的出现,我们还是需要尽快掌握运用这些工具的能力,以便提高工作效率。

相关推荐
你觉得20519 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
啊喜拔牙19 小时前
1. hadoop 集群的常用命令
java·大数据·开发语言·python·scala
Elasticsearch19 小时前
Elasticsearch:使用机器学习生成筛选器和分类标签
elasticsearch
别惊鹊19 小时前
MapReduce工作原理
大数据·mapreduce
8K超高清19 小时前
中国8K摄像机:科技赋能文化传承新图景
大数据·人工智能·科技·物联网·智能硬件
2401_8712905820 小时前
MapReduce 的工作原理
大数据·mapreduce
SelectDB技术团队21 小时前
Apache Doris 2025 Roadmap:构建 GenAI 时代实时高效统一的数据底座
大数据·数据库·数据仓库·人工智能·ai·数据分析·湖仓一体
你觉得2051 天前
浙江大学朱霖潮研究员:《人工智能重塑科学与工程研究》以蛋白质结构预测为例|附PPT下载方法
大数据·人工智能·机器学习·ai·云计算·aigc·powerpoint
益莱储中国1 天前
世界通信大会、嵌入式展及慕尼黑上海光博会亮点回顾
大数据
Loving_enjoy1 天前
基于Hadoop的明星社交媒体影响力数据挖掘平台:设计与实现
大数据·hadoop·数据挖掘