ES语法(一)概括

一、语法

1、请求方式

Elasticsearch(ES)使用基于 JSON 的查询 DSL(领域特定语言)来与数据交互。

一个 ElasticSearch 请求和任何 HTTP 请求一样由若干相同的部件组成:

curl -X<VERB> '<PROTOCOL>://<HOST>:<PORT>/<PATH>?<QUERY_STRING>' -d '<BODY>'

|-------------------|--------------------------------------------------------------------------------------|
| 被 < > 标记的部件 | 含义 |
| VERB | 适当的 HTTP 方法 或 谓词 : GET`、 `POST`、 `PUT`、 `HEAD 或者 `DELETE`。 |
| PROTOCOL | http 或者 https`(如果你在 ElasticSearch 前面有一个 `https 代理) |
| HOST | ElasticSearch 集群中任意节点的主机名,或者用 localhost 代表本地机器上的节点。 |
| PORT | 运行 ElasticSearch HTTP 服务的端口号,默认是 9200 。 |
| PATH | API 的终端路径(例如 _count 将返回集群中文档数量)。Path 可能包含多个组件,例如:_cluster/stats 和 _nodes/stats/jvm 。 |
| QUERY_STRING | 任意可选的查询字符串参数 (例如 pretty 将格式化地输出 JSON 返回值,使其更容易阅读) |
| BODY | 一个 JSON 格式的请求体 (如果请求需要的话) |

2、大小写敏感

es是大小写敏感的。

二、请求类型

1、GET请求

GET 请求通常用于查询操作;

它会通过 URL 参数传递请求数据,查询条件较简单时适用。

2、POST请求

POST 请求通常用于提交数据,如添加或更新文档;

也可用于执行复杂的查询:复杂查询或聚合(特别是当查询语句较大时,无法通过 URL 传递)

三、查询返回结果

执行命令:索引库名称/_search

空搜索的结果为:

{
  "took": 2,		# 该命令请求花费了多长时间,单位:毫秒。
  "timed_out": false,		# 搜索是否超时
  "_shards": {		# 搜索分片信息
    "total": 3,		# 搜索分片总数
    "successful": 3,		# 搜索成功的分片数量
    "skipped": 0,		# 没有搜索的分片,跳过的分片
    "failed": 0		# 搜索失败的分片数量
  },
  "hits": {		# 搜索结果集。需要的一切数据都是从hits中获取
    "total": 21798,		# 返回多少条数据
    "max_score": 1,		#返回结果中,最大的匹配度分值
    "hits": [		# 默认查询前十条数据,根据分值降序排序,这里为了节省地方,把默认查询的前十条数据删了9条,只剩下一条数据
      {
        "_index": "",		# 索引库名称
        "_type": "",		# 类型名称
        "_id": "",		# 该条数据的id
        "_score": 1,		# 关键字与该条数据的匹配度分值
        "_routing": "",		# routing参数是一个可选参数,默认使用文档的_id值,用于计算文档所属分片
        "_source": {		# 索引库中类型,返回结果字段,不指定的话,默认全部显示出来
          "id": 1,
          "orderNo": "",
          "appId": "",
          "componentAppId": "",
          "settleNo": "",
          "outSettleNo": "",
          "settleAmount": 5,
          "orderAmount": 7,
          "settleStatus": 3,
          "paymentChannel": 1,
          "version": 2,
          "settleTime": ,
          "createTime": ,
          "updateTime": ,
          "promotionAccountId": "",
          "invoiceStatus": 1,
          "promotionTypeValue": 0,
          "commissionRateFeeCentAmount": 0,
          "commissionChargeFeeCentAmount": 0,
          "promotionFeeCentAmount": 2,
          "developerPromotionFeeCentAmount": 0,
          "promotionType": ""
        }
      }
    ]
  }
}

按照从上到下的顺序,一共四个返回值,took,timed_out,_shards,hits。

1、took

该命令请求花费了多长时间,单位:毫秒。

2、timed_out

搜索是否超时。

3、shards

搜索分片信息。

(1)total

搜索分片总数。

(2)successful

搜索成功的分片数量。

(3)skipped

没有搜索的分片,跳过的分片。

(4)failed

搜索失败的分片数量。

4、hits

搜索结果集,需要的一切数据都是从hits中获取。

(1)total

返回多少条数据。

(2)max_score

返回结果中,最大的匹配度分值。

(3)hits

默认查询前十条数据,根据分值降序排序。

(4)_index

索引库名称。

(5)_type

类型名称

(6)_id

该条数据的id。

(7)_score

关键字与该条数据的匹配度分值。

(8)_source

索引库中类型,返回结果字段,不指定的话,默认全部显示出来。

四、查询语法介绍

语法GET /索引/类型/_search 查询条件。

这个查询条件有两种写法,

1、URL 拼接

在GET的url中指定参数,这种方法比较简单。如

(1)查询所有

GET /索引名称/_search

(2) 条件查询:

GET /es-test/_search?q=blog

(3)分页查询:

GET /es-test/_search?size=5&from=10
2、DSL(常用)

还有一种是ES查询表达式 (DSL) 检索,所有查询都以 JSON 格式表示,通常包含 queryfilter 字段。在执行查询时,通常向特定的索引发起请求,使用 HTTP 方法(GET 或 POST)。JSON 的常用字段有:

(1)sort

封装排序

(2) _source

指定查询结果的字段,不指定则默认返回所有字段

GET /wtyy-test/user/_search
{
    "query":{"match_all":{}},
    "_source":["name","age"]
}
(3)query

封装查询条件

(4)分页条件

from、size

(5)highlight高亮

通常自己开发搜索引擎的时候,往往需要对搜索结果中的关键词高亮这种功能。注意,带条件查询高亮才生效,如无条件分页查询高亮是不生效的。

GET  wtyy-test/user/_search
{
  "query": {
    "match": {
      "address": "北京"
    }
  },
  "highlight": {
    "fields": {
      "address": {}
    }
  }
}

返回:

{
  "took": 61,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 0.7787034,
    "hits": [
      {
        "_index": "wtyy-test",
        "_type": "user",
        "_id": "1",
        "_score": 0.7787034,
        "_source": {
          "name": "王五1",
          "age": 1,
          "address": "湖北",
          "school": "测试学校"
        },
        "highlight": {
          "address": [
            "湖<em>北</em>"
          ]
        }
      }
    ]
  }
}

在返回体中有一个 highlight 字段,里面对 message 字段进行高亮处理: 关键词使用了 <em></em> 标签包围了。可以使用 css 修改对 <em> 标签的样式,以实现关键词高亮效果。

五、es的并发处理

使用的乐观锁 在 后面加上 version:

POST  /user/student/1?version=3
{
  "name":"zyk",
  "age":0
}

只有version = 当前记录的version的时候才能修改成功。es 可以自动控制 vserion 通过 ,version_type指定 ,version_type=external 要求 version 大于当前的version ,version_type=internal 这个是默认值 ,必须等于当前的值<br>version_type=external_gte 大于等于当前的version<br>version_type=force 已经废弃了不能用了,我也不知道以前什么意思,提升, Validation Failed: ``1``: version type [force] may no longer be used

POST  /user/student/1?version_type=external&version=505
{
  "name":"zyk",
  "age":0
}
相关推荐
DavidSoCool11 分钟前
es 3期 第25节-运用Rollup减少数据存储
大数据·elasticsearch·搜索引擎
Elastic 中国社区官方博客14 分钟前
使用 Elasticsearch 导航检索增强生成图表
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
Ray.199830 分钟前
Flink在流处理中,为什么还会有窗口的概念呢
大数据·flink
抛砖者30 分钟前
3.Flink中重要API的使用
大数据·flink
金州饿霸34 分钟前
Flink运行时架构
大数据·flink
金州饿霸34 分钟前
Flink中的时间和窗口
大数据·flink
watersink2 小时前
面试题库笔记
大数据·人工智能·机器学习
数字化综合解决方案提供商2 小时前
【Rate Limiting Advanced插件】赋能AI资源高效分配
大数据·人工智能
Elastic 中国社区官方博客3 小时前
设计新的 Kibana 仪表板布局以支持可折叠部分等
大数据·数据库·elasticsearch·搜索引擎·信息可视化·全文检索·kibana
GIS数据转换器3 小时前
城市生命线安全保障:技术应用与策略创新
大数据·人工智能·安全·3d·智慧城市