es的检索-DSL语法和Java-RestClient实现

基本语法

json 复制代码
GET /索引库名/_search
{
  "query": {
    "查询类型": {"查询条件"}
  }
}

RestClient的导入在RestClient操作索引库和文档有介绍

查询所有

json 复制代码
# 查询所有
GET /test/_search
{
  "query": {
    "match_all": {}
  }
}
java 复制代码
SearchRequest request = new SearchRequest("test");
request.source().query(QueryBuilders.matchAllQuery());
SearchResponse response = client.search(request, RequestOptions.DEFAULT);

全文检索查询

对用户输入的内容进行分词,然后去倒排索引库进行检索,常用于搜索框

json 复制代码
# match查询
GET /test/_search
{
  "query": {
    "match": {
      "字段": "文本"
    }
  }
}
java 复制代码
SearchRequest request = new SearchRequest("test");
request.source().query(QueryBuilders.matchQuery("字段","文本"));
SearchResponse response = client.search(request, RequestOptions.DEFAULT);
System.out.println(response.getHits().getTotalHits().value);
json 复制代码
# mutil_match查询
GET /test/_search
{
  "query": {
    "multi_match": {
      "query": "文本",
      "fields": ["字段1", "字段2", ...]
    }
  }
}

一般情况下,多字段查询都会copy_to到一个字段中,然后使用match查询来替代multi_match查询,能够提高查询效率。
精确查询

精确查询不会对搜索条件进行分词,一般查找keyword,数值,日期,boolean等字段。

  • trem :根据词条精确查找,类似于mysql的=
  • range :根据词条的范围查询。gt gte lt lte分别是大于 大于等于 小于 小于等于
json 复制代码
# term查询,查找price是8的文档
GET /test/_search
{
  "query": {
    "term": {
      "price": {
        "value": "8"
      }
    }
  }
}
# 查询price大于10并且小于20的文档
GET /test/_search
{
  "query": {
    "range": {
      "price": {
        "gte": 10,
        "lte": 20
      }
    }
  }
}
java 复制代码
SearchRequest request = new SearchRequest("test");
request.source().query(QueryBuilders.termQuery("字段","文本"));
request.source().query(QueryBuilders.rangeQuery("price").gt(1).lt(5))
SearchResponse response = client.search(request, RequestOptions.DEFAULT);
System.out.println(response.getHits().getTotalHits().value);

Function Score Query

我们在使用match查询的时候,展示的文档的顺序会根据改文档与搜索词条的相关性(抽象为一个分数,es进行打分)进行排序。

而常见的相关性算法是TF-IDF和BM25:

在es5.0之前使用的是TF-IDF算法,而之后使用的是BM25算法。随着词频的增加,TF-IDF会无限变大,而BM25就比较稳定。

Function Score Query ,可以修改文档的相关性算分。

复合查询(Boolean Query)

java 复制代码
SearchRequest request = new SearchRequest("test");
BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
boolQuery.must(QueryBuilders.matchAllQuery());// boolQuery.must(QueryBuilders.matchQuery("all", key));
boolQuery.filter(QueryBuilders.termQuery("字段","文本"));
String sortBy = params.getSortBy();
if (!sortBy.equals("default")) {
    request.source().sort(sortBy);
}
request.source().query(boolQuery);
Integer size = params.getSize();
Integer page = params.getPage();
request.source().from((page - 1) * size).size(size);
SearchResponse response = client.search(request, RequestOptions.DEFAULT);
相关推荐
武子康13 小时前
调查研究-197 FAISS vs Elasticsearch 全面对比:从向量检索、全文搜索到 RAG 选型指南
人工智能·elasticsearch·agent
Elasticsearch2 天前
Elasticsearch ES|QL:现已支持视图、子查询和读取时模式定义
elasticsearch
Elasticsearch4 天前
Kibana 中的 SNMP 拓扑数据:从采集到 Canvas
elasticsearch
Elasticsearch6 天前
3个信号、2个环境变量、0个采集器:使用 Python 和 Elastic 的托管 OTLP 端点实现 OpenTelemetry
elasticsearch
Elasticsearch8 天前
如何通过 Claude Code 来写入 CSV 数据到 Elasticsearch
elasticsearch
大志哥12310 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
TableRow10 天前
参数化搜索的实现原理:从多维索引到查询优化
elasticsearch·全文检索
醉颜凉10 天前
Elasticsearch高性能优化:Bulk API大规模数据导入性能调优全攻略
elasticsearch·性能优化·jenkins
Ysouy10 天前
Spring Data Elasticsearch 全流程学习教程
java·spring·elasticsearch