一、语法
1、请求方式
Elasticsearch(ES)使用基于 JSON 的查询 DSL(领域特定语言)来与数据交互。
一个 ElasticSearch 请求和任何 HTTP 请求一样由若干相同的部件组成:
curl -X<VERB> '<PROTOCOL>://<HOST>:<PORT>/<PATH>?<QUERY_STRING>' -d '<BODY>'
|-------------------|--------------------------------------------------------------------------------------|
| 被 < > 标记的部件 | 含义 |
| VERB | 适当的 HTTP 方法 或 谓词 : GET`、 `POST`、 `PUT`、 `HEAD 或者 `DELETE`。 |
| PROTOCOL | http 或者 https`(如果你在 ElasticSearch 前面有一个 `https 代理) |
| HOST | ElasticSearch 集群中任意节点的主机名,或者用 localhost 代表本地机器上的节点。 |
| PORT | 运行 ElasticSearch HTTP 服务的端口号,默认是 9200 。 |
| PATH | API 的终端路径(例如 _count 将返回集群中文档数量)。Path 可能包含多个组件,例如:_cluster/stats 和 _nodes/stats/jvm 。 |
| QUERY_STRING | 任意可选的查询字符串参数 (例如 pretty 将格式化地输出 JSON 返回值,使其更容易阅读) |
| BODY | 一个 JSON 格式的请求体 (如果请求需要的话) |
2、大小写敏感
es是大小写敏感的。
二、请求类型
1、GET请求
GET
请求通常用于查询操作;
它会通过 URL 参数传递请求数据,查询条件较简单时适用。
2、POST请求
POST
请求通常用于提交数据,如添加或更新文档;
也可用于执行复杂的查询:复杂查询或聚合(特别是当查询语句较大时,无法通过 URL 传递)
三、查询返回结果
执行命令:索引库名称/_search
空搜索的结果为:
{
"took": 2, # 该命令请求花费了多长时间,单位:毫秒。
"timed_out": false, # 搜索是否超时
"_shards": { # 搜索分片信息
"total": 3, # 搜索分片总数
"successful": 3, # 搜索成功的分片数量
"skipped": 0, # 没有搜索的分片,跳过的分片
"failed": 0 # 搜索失败的分片数量
},
"hits": { # 搜索结果集。需要的一切数据都是从hits中获取
"total": 21798, # 返回多少条数据
"max_score": 1, #返回结果中,最大的匹配度分值
"hits": [ # 默认查询前十条数据,根据分值降序排序,这里为了节省地方,把默认查询的前十条数据删了9条,只剩下一条数据
{
"_index": "", # 索引库名称
"_type": "", # 类型名称
"_id": "", # 该条数据的id
"_score": 1, # 关键字与该条数据的匹配度分值
"_routing": "", # routing参数是一个可选参数,默认使用文档的_id值,用于计算文档所属分片
"_source": { # 索引库中类型,返回结果字段,不指定的话,默认全部显示出来
"id": 1,
"orderNo": "",
"appId": "",
"componentAppId": "",
"settleNo": "",
"outSettleNo": "",
"settleAmount": 5,
"orderAmount": 7,
"settleStatus": 3,
"paymentChannel": 1,
"version": 2,
"settleTime": ,
"createTime": ,
"updateTime": ,
"promotionAccountId": "",
"invoiceStatus": 1,
"promotionTypeValue": 0,
"commissionRateFeeCentAmount": 0,
"commissionChargeFeeCentAmount": 0,
"promotionFeeCentAmount": 2,
"developerPromotionFeeCentAmount": 0,
"promotionType": ""
}
}
]
}
}
按照从上到下的顺序,一共四个返回值,took,timed_out,_shards,hits。
1、took
该命令请求花费了多长时间,单位:毫秒。
2、timed_out
搜索是否超时。
3、shards
搜索分片信息。
(1)total
搜索分片总数。
(2)successful
搜索成功的分片数量。
(3)skipped
没有搜索的分片,跳过的分片。
(4)failed
搜索失败的分片数量。
4、hits
搜索结果集,需要的一切数据都是从hits中获取。
(1)total
返回多少条数据。
(2)max_score
返回结果中,最大的匹配度分值。
(3)hits
默认查询前十条数据,根据分值降序排序。
(4)_index
索引库名称。
(5)_type
类型名称
(6)_id
该条数据的id。
(7)_score
关键字与该条数据的匹配度分值。
(8)_source
索引库中类型,返回结果字段,不指定的话,默认全部显示出来。
四、查询语法介绍
语法GET /索引/类型/_search 查询条件。
这个查询条件有两种写法,
1、URL 拼接
在GET的url中指定参数,这种方法比较简单。如
(1)查询所有
GET /索引名称/_search
(2) 条件查询:
GET /es-test/_search?q=blog
(3)分页查询:
GET /es-test/_search?size=5&from=10
2、DSL(常用)
还有一种是ES查询表达式 (DSL) 检索,所有查询都以 JSON 格式表示,通常包含 query
或 filter
字段。在执行查询时,通常向特定的索引发起请求,使用 HTTP 方法(GET 或 POST)。JSON 的常用字段有:
(1)sort
封装排序
(2) _source
指定查询结果的字段,不指定则默认返回所有字段
GET /wtyy-test/user/_search
{
"query":{"match_all":{}},
"_source":["name","age"]
}
(3)query
封装查询条件
(4)分页条件
from、size
(5)highlight高亮
通常自己开发搜索引擎的时候,往往需要对搜索结果中的关键词高亮这种功能。注意,带条件查询高亮才生效,如无条件分页查询高亮是不生效的。
GET wtyy-test/user/_search
{
"query": {
"match": {
"address": "北京"
}
},
"highlight": {
"fields": {
"address": {}
}
}
}
返回:
{
"took": 61,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 0.7787034,
"hits": [
{
"_index": "wtyy-test",
"_type": "user",
"_id": "1",
"_score": 0.7787034,
"_source": {
"name": "王五1",
"age": 1,
"address": "湖北",
"school": "测试学校"
},
"highlight": {
"address": [
"湖<em>北</em>"
]
}
}
]
}
}
在返回体中有一个 highlight 字段,里面对 message 字段进行高亮处理: 关键词使用了 <em></em>
标签包围了。可以使用 css 修改对 <em>
标签的样式,以实现关键词高亮效果。
五、es的并发处理
使用的乐观锁 在 后面加上 version:
POST /user/student/1?version=3
{
"name":"zyk",
"age":0
}
只有version = 当前记录的version的时候才能修改成功。es 可以自动控制 vserion 通过 ,version_type指定 ,version_type=external 要求 version 大于当前的version ,version_type=internal 这个是默认值 ,必须等于当前的值<br>version_type=external_gte 大于等于当前的version<br>version_type=force 已经废弃了不能用了,我也不知道以前什么意思,提升, Validation Failed: ``1``: version type [force] may no longer be used
POST /user/student/1?version_type=external&version=505
{
"name":"zyk",
"age":0
}