elasticsearch中的DSL语句操作

文章目录

概要

基本上这些,有需要的再补充:

创建索引时的关键字段

  • number_of_shards: 索引中主分片的数量,决定了数据分布的广度和横向扩展的能力。一旦设置好之后不能改变。
  • number_of_replicas: 每个主分片拥有的副本分片的数量,用于提供数据冗余和提高查询的并发能力。
  • mappings: 定义索引中字段名和字段数据类型的容器,可以看作是Elasticsearch中的"表结构"。

文档操作中的关键字段

  • _doc: 表示文档类型,在7.x之前的版本中Elasticsearch支持多种类型,但在7.x之后已被弃用,统一使用_doc。
  • _update: 用于更新现存文档的关键字。
  • doc: 在更新操作中,表示需要被更新的字段和它们新的值。

查询操作中的关键字段

  • query: 包含了所有查询条件的容器。
  • match: 一个全文搜索的查询,匹配指定字段中包含的文本。
  • term: 用于精确值匹配,不分析字段内容,用于不分词的字段或精确值查询。
  • bool: 用于组合多个查询子句,并可以通过must(必须匹配)、should(至少匹配一个)、must_not(必须不匹配)、filter(过滤且不计算得分)等来定义查询逻辑。
  • filter: 类似于查询,但它不计算得分而只是过滤数据,这通常有助于提高性能。
  • range: 用于匹配指定字段值处于特定范围的文档。
  • gte, lte: 分别代表范围查询中的"大于等于"和"小于等于"。

分页和排序中的关键字段

  • from: 用于分页,表示从哪个文档开始返回。
  • size: 也用于分页,表示返回多少个查询结果。
  • sort: 用于指定根据哪个字段以什么样的顺序来排序结果。

高亮查询的关键字段

  • highlight: 用于配置结果高亮显示的容器。
  • fields: 指定哪些字段需要高亮显示。

聚合操作的关键字段

  • aggs (或aggregations): 用于配置聚合操作的容器。
  • terms: 一个典型的桶(buckets)聚合,用来创建基于某个字段的不同值的桶。
  • avg, sum, min, max: 各种度量聚合类型,用来计算平均值、求和、最小值、最大值等。

每个字段和字段名在Elasticsearch查询DSL中都有特定的目的和行为。查询的编写需要对这些关键字段及其用法有深刻的了解。在构造查询时,这些字段以JSON对象的形式组合在一起,形成对Elasticsearch数据的精确和高效查询。

操作语句

索引操作:

1、创建索引 (Create an Index)

java 复制代码
PUT /my_index               // 使用PUT动作创建一个名为"my_index"的索引
{
  "settings": {             // "settings"类别用于设定索引相关的具体配置
    "number_of_shards": 1,      // "number_of_shards"指定了索引分片的数量
    "number_of_replicas": 1     // "number_of_replicas"指定了每个分片的副本数量
  },
  "mappings": {             // "mappings"类别用于定义索引中字段的名称和类型
    "properties": {             // "properties"定义了索引包含的字段及其数据类型
      "title": { "type": "text" },      // "title": 字段名,类型为"text",适用于全文搜索
      "date": { "type": "date" },       // "date": 字段名,类型为"date",存储日期
      "views": { "type": "integer" }    // "views": 字段名,类型为"integer",存储整数
    }
  }
}

2、查看索引 (Get Index Information)

java 复制代码
GET /my_index               // 使用GET动作获取名为"my_index"的索引信息

3、更新索引设置 (Update Index Settings)

java 复制代码
PUT /my_index/_settings     // 使用PUT动作更新名为"my_index"的索引设置
{
  "settings": {
    "number_of_replicas": 2  // "number_of_replicas"更新索引副本的数量为2
  }
}

4、删除索引 (Delete an Index)

java 复制代码
DELETE /my_index            // 使用DELETE动作删除名为"my_index"的索引

5、删除索引中的所有数据(Delete By Query)

java 复制代码
POST /my_index/_delete_by_query  // 使用POST动作删除满足查询条件的索引内数据
{
  "query": {                      // "query"定义删除操作的查询条件
    "match_all": {}               // "match_all"查询匹配索引中的所有文档,即删除所有数据
  }
}

6、关闭索引 (Close an Index)

java 复制代码
POST /my_index/_close           // 使用POST动作关闭名为"my_index"的索引

7、打开索引 (Open an Index)

java 复制代码
POST /my_index/_open            // 使用POST动作打开名为"my_index"的索引

这些基本操作是管理Elasticsearch索引的关键。创建索引时,可以定义索引的结构和行为,例如分片数量、副本数量,以及字段的类型。更新设置,删除索引中的数据,以及整个索引的删除,都是索引生命周期的常见操作。通过这些操作,你可以维护、优化或删除存储在Elasticsearch集群中的数据。

数据查询

1、Match Query

进行全文搜索,会对查询的文本进行分词。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"部分定义了查询的条件
    "match": {                    // "match"查询用于全文搜索,支持文本分析
      "field_name": "text to search" // "field_name"是你希望搜索的字段,后面是搜索的文本
    }
  }
}

2、Match Phrase 查询

搜索与指定短语匹配的文档,保留短语中词语的相对位置。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "match_phrase": {             // "match_phrase"用于精确短语匹配,考虑词组内的词语顺序
      "field_name": "exact phrase" // "field_name"指定字段,"exact phrase"为要匹配的短语
    }
  }
}

3、Range 查询

对数值或日期字段进行范围查询。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "range": {                    // "range"查询检索指定范围内的值
      "field_name": {             // "field_name"是你想要检索范围的字段
        "gte": 10,                // "gte"代表大于等于10
        "lte": 20                 // "lte"代表小于等于20
      }
    }
  }
}

4、Bool 查询

组合多个查询条件,支持must(必须)、should(至少一个)和must_not(必须不)关键字。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "bool": {                     // "bool"查询组合多个查询条件
      "must": [                   // "must"关键字表示条件必须匹配
        { "match": { "field1": "value1" } }
      ],
      "should": [                 // "should"关键字表示至少一个条件应该匹配
        { "term": { "field2": "value2" } }
      ],
      "must_not": [               // "must_not"关键字表示条件必须不匹配
        { "range": { "field3": { "gt": "value3" } } }
      ]
    }
  }
}

5、Term 查询

对字段进行精确匹配。

java 复制代码
GET /my_index/_search
{
  "query": {  // "query"定义查询条件
    "term": { // "term"查询执行精确匹配
      "field_name": "exact_value" // "field_name"是要匹配的字段; "exact_value"是精确查询的精确值,通常用于keyword标签或其他不分析的文本字段
    }
  }
}

6、Terms 查询

针对一个字段匹配多个精确值。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "terms": {                    // "terms"查询可用于一个字段匹配多个值
      "field_name": ["value1", "value2"] // "field_name"是要匹配的字段; 数组包含所有要匹配的精确值
    }
  }
}

7、Exists 查询

查询指定字段中有值的文档。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "exists": {                   // "exists"查询找出指定字段有值的文档
      "field": "field_name"       // "field"字段名说明哪个字段必须有值
    }
  }
}

8、Wildcard 查询

进行通配符搜索,允许使用星号(*)和问号(?)作为通配符,星号代表零个或多个字符,问号代表一个字符。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "wildcard": {                 // "wildcard"查询支持使用通配符进行搜索
      "field_name": "te*t?"       // "field_name"是要搜索的字段; "te*t?"示例中,搜索以"te"开头以一个任意字符结束,中间有任意多个字符的文本
    }
  }
}

9、Prefix 查询

查找具有指定前缀的字段值。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "prefix": {                   // "prefix"查询用于查找具有指定前缀的字段值
      "field_name": "prefix_value" // "field_name"是字段名; "prefix_value"是需要匹配的前缀
    }
  }
}

10、Fuzzy 查询

允许查询与指定的模糊匹配值相近的词。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "fuzzy": {                    // "fuzzy"查询允许错误拼写(Levenshtein 编辑距离)
      "field_name": {             // "field_name"是字段名
        "value": "text",          // "value"指定要搜索的近似值
        "fuzziness": "AUTO"       // "fuzziness"定义模糊程度,"AUTO"将自动根据长度选择距离
      }
    }
  }
}

11、Query String 查询

支持直接输入复杂查询字符串,包含各类操作符。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "query_string": {             // "query_string"支持直接传入查询表达式
      "default_field": "field_name",   // "default_field"指定默认查询字段
      "query": "(new york city) OR (big apple)"  // "query"中定义复杂查询字符串
    }
  }
}

12、Multi-Match 查询

在多个字段上执行相同的查询条件。

java 复制代码
GET /my_index/_search
{
  "query": {                      // "query"定义查询条件
    "multi_match": {              // "multi_match"在多个字段上进行文本搜索
      "query": "search text",     // "query"是要匹配的文本
      "fields": ["field1", "field2^3"] // "fields"定义了多个字段,给"field2"一个更高的权重(3)
    }
  }
}

Elasticsearch 提供了多种查询类型和相关参数,使得用户能够根据具体的需求灵活地构建查询。每个查询类型针对不同的使用场景和需求,从简单的文本匹配到基于地理位置和其他高级功能,为数据检索提供了广泛的可能性。

继续介绍一些更高级或特殊用途的查询类型:

13、Geo-空间查询(Geospatial Queries)

java 复制代码
GET /my_index/_search
{
  "query": {
    "geo_distance": {            // "geo_distance"查询基于地理位置的距离查询
      "distance": "200km",       // "distance"指定查询范围的距离
      "location": {              // "location"是存储地理坐标的字段
        "lat": 40.73,
        "lon": -74.1
      }
    }
  }
}

14、聚合 (Aggregations)

对数据进行统计分析。

java 复制代码
GET /my_index/_search
{
  "size": 0,                   // "size": 0表示不返回查询结果,仅返回聚合结果
  "aggs": {                    // "aggs"定义了聚合操作
    "popular_tags": {          // "popular_tags"自定义该聚合操作的名称
      "terms": {               // "terms"聚合为桶聚合,统计字段中出现的唯一值
        "field": "tags"        // "field"指定了要执行聚合统计的字段
      }
    }
  }
}

15、Highlighting(高亮)

返回查询结果时突出显示匹配的字符串。

java 复制代码
GET /my_index/_search
{
  "query": {  
    "match": { 
      "content": "search term"
    }
  },
  "highlight": {              // "highlight"指定了需要高亮的字段
    "fields": {
      "content": {}           // "content"是文档内的一个字段,将会被高亮显示匹配的部分
    }
  }
}

16、Suggesters(建议器)

提供基于输入文本的建议。

java 复制代码
GET /my_index/_search
{
  "suggest": {                // "suggest"定义了建议查询
    "text": "tring out elasticsearch", // "text"定义了要被纠正或提出建议的文本
    "simple_phrase": {        // "simple_phrase"是自定义的建议器名称
      "phrase": {             // "phrase"定义了词组建议器类型,用于纠正文本片段
        "field": "content"    // "field"指定了用于生成建议的字段
      }
    }
  }
}

17、Scripting(脚本)

使用脚本进行动态计算。

java 复制代码
GET /my_index/_search
{
  "query": {  
    "script_score": {        // "script_score"查询允许基于脚本表达式调整得分
      "query": { "match_all": {} }, // "query"定义了基础查询
      "script": {            // "script"定义了用于调整查询得分的脚本
        "source": "math.log(_score * 2) + params.my_modifier", // "source"脚本本身
        "params": {          // "params"定义了传递给脚本的参数
          "my_modifier": 0.1
        }
      }
    }
  }
}

这只是Elasticsearch提供的查询功能中的一小部分。Elasticsearch查询DSL非常灵活和强大,支持各种条件和结构复杂的查询,满足几乎所有搜索需求。学习和掌握Elasticsearch查询DSL是进行高效数据检索不可或缺的。

小结

没什么结的,就是个API用就行了

相关推荐
测试界的酸菜鱼8 分钟前
Python 大数据展示屏实例
大数据·开发语言·python
时差95310 分钟前
【面试题】Hive 查询:如何查找用户连续三天登录的记录
大数据·数据库·hive·sql·面试·database
让学习成为一种生活方式12 分钟前
R包下载太慢安装中止的解决策略-R语言003
java·数据库·r语言
Mephisto.java12 分钟前
【大数据学习 | kafka高级部分】kafka中的选举机制
大数据·学习·kafka
晨曦_子画18 分钟前
编程语言之战:AI 之后的 Kotlin 与 Java
android·java·开发语言·人工智能·kotlin
Mephisto.java18 分钟前
【大数据学习 | kafka高级部分】kafka的优化参数整理
大数据·sql·oracle·kafka·json·database
道可云20 分钟前
道可云人工智能&元宇宙每日资讯|2024国际虚拟现实创新大会将在青岛举办
大数据·人工智能·3d·机器人·ar·vr
成都古河云31 分钟前
智慧场馆:安全、节能与智能化管理的未来
大数据·运维·人工智能·安全·智慧城市
软工菜鸡38 分钟前
预训练语言模型BERT——PaddleNLP中的预训练模型
大数据·人工智能·深度学习·算法·语言模型·自然语言处理·bert
南宫生41 分钟前
贪心算法习题其三【力扣】【算法学习day.20】
java·数据结构·学习·算法·leetcode·贪心算法