ElasticSearch学习之路

前言

为什么学ElasticSearch?

数据一般有如下三种类型:

  1. 结构化数据,如:MySQL的表,一般通过索引提高查询效率
  2. 非结构化数据,如:图片、音频等不能用表结构表示的数据,一般保存到mongodb、redis、hbase等非关系型数据库,通过key-value查询
  3. 半结构化数据,如:json、xml文件,一般保存到mongodb、redis、hbase等非关系型数据库,通过key-value查询

对于结构化数据而言,字段不容易扩展,且有些数据是非结构化的,如:日志,为了提高查询效率,可以使用ElasticSearch

一、快速入门

1.1 Elasticsearch 介绍

Elaticsearch,简称为 ES, 是一个开源的高扩展的分布式全文搜索引擎, 是整个 ElasticStack 技术栈的核心。

全文搜索引擎:类似谷歌、百度、博客文章、还有日志的搜索,它们是根据网页的关键字生成索引,我们输入关键字时就会匹配到所有网页并返回,而对于非结构化的数据文本,关系型数据库不能很好的支持。

The Elastic Stack, 包括 Elasticsearch、 Kibana、 Beats 和 Logstash(也称为 ELK Stack),能够安全可靠地获取任何来源、任何格式的数据,然后实时地对数据进行搜索、分析和可视化。

它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理 PB 级别的数据。

1.2 安装环境(以win10为例)

官方网址:https://www.elastic.co/cn/downloads/?elektra=home\&storm=hero

elasticsearch新增数据

bash 复制代码
curl -X POST "http://localhost:9200/自定义索引名称/_doc/自定义文档id" -H 'Content-Type: application/json' -d'
{
  "field1": "value1",
  "field2": "value2"
}
'

查询数据

bash 复制代码
curl -X GET "http://localhost:9200/自定义索引名称/_doc/自定义文档id"

批量插入数据

bash 复制代码
curl -X POST "http://localhost:9200/_bulk?pretty" -H "Content-Type: application/json;charset=UTF-8" -d '
{"index":{"_index": "website", "_id":"1" }}
{"title1" : "My updated blog post"}
{"index":{"_index": "website", "_id":"2" }}
{"title2" : "My updated blog post123"}
'

Elasticsearch命令(curl)大全

https://blog.csdn.net/m0_37739193/article/details/78228876

相关推荐
SelectDB14 小时前
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率
大数据·后端·云原生
WhoAmI14 小时前
MapReduce框架原理解析一:InputFormat
大数据·hadoop
WhoAmI14 小时前
MapReduce框架原理解析三:OutputFormat
大数据·hadoop
WhoAmI14 小时前
MapReduce框架原理解析二:Shuffle
大数据·hadoop
大大大大晴天2 天前
Hudi技术内幕:Key Generation原理与实践
大数据
Elasticsearch2 天前
3个信号、2个环境变量、0个采集器:使用 Python 和 Elastic 的托管 OTLP 端点实现 OpenTelemetry
elasticsearch
Elasticsearch4 天前
如何通过 Claude Code 来写入 CSV 数据到 Elasticsearch
elasticsearch
得物技术5 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子5 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据