ElasticSearch之结构化搜索

写在前面

本文看下es的结构化搜索,结构化搜索顾名思义就是对结构化数据的搜索,那么什么是结构话数据呢?我的理解是具有一定规则的数据就是结构化,在es中包括但不限于如下:

复制代码
1:Boolean
    只有true和false
2:整数
    就是整数,不会是其他的
3:日期
    日期的格式虽然可能有多种,但也是有规则的
4:枚举类的text
    普通的text肯定不是结构化数据,比如一条日志,但是如性别,风险等级,彩笔的颜色等,都是有限的枚举值,所以也是结构化的数据
5:文档的key
    是有限的枚举值,所以也是有规则的,所以也是结构化数据。

针对上述数据的搜索,我们可以采用term搜索 以及前缀搜索词项查询

结构化查询在一定程度上可以认为是精准匹配,所以可以根据具体情况考虑不算分

1:例子

1.1:布尔,数字

复制代码
# 1:删除老的,避免影响
DELETE /products
POST /products/_bulk
{"index": {"_id": 1}}
{"price":10,"available":true,"date":"2018-01-01","productID":"XHDK-A-1293-#fJ3"}
{"index": {"_id": 2}}
{"price":20,"available":true,"date":"2019-01-01","productID":"KDKE-B-9947-#kL5"}
{"index": {"_id": 3}}
{"price":30,"available":true,"productID":"JODL-X-1937-#pV7"}
{"index": {"_id": 4}}
{"price":30,"available":false,"productID":"QQPX-R-3956-#aD8"}

# 2:对布尔查询,并且算分,可以查询到3条
POST products/_search
{
  "profile": "true",
  "explain": true,
  "query": {
    "term": {
      "available": true
    }
  }
}
# 3:对布尔查询,不算分,可以查询到3条
POST products/_search
{
    "profile": "true",
    "explain": true,
    "query": {
        "constant_score": {
            "filter": {
                "term": {
                    "available": true
                }
            }
        }
    }
}

# 4:数字range
POST products/_search
{
    "query": {
        "constant_score": {
            "filter": {
                "range": {
                    "price": {
                        "gte": 20,
                        "lte": 30
                    }
                }
            }
        }
    }
}

1.2:日期

复制代码
# 1:删除老的,避免影响
DELETE /products
POST /products/_bulk
{"index": {"_id": 1}}
{"price":10,"available":true,"date":"2018-01-01","productID":"XHDK-A-1293-#fJ3"}
{"index": {"_id": 2}}
{"price":20,"available":true,"date":"2019-01-01","productID":"KDKE-B-9947-#kL5"}
{"index": {"_id": 3}}
{"price":30,"available":true,"productID":"JODL-X-1937-#pV7"}
{"index": {"_id": 4}}
{"price":30,"available":false,"productID":"QQPX-R-3956-#aD8"}

# 2:日期range
POST products/_search
{
    "query": {
        "constant_score": {
            "filter": {
                "range": {
                    "date": {
                        "gte": "now-7y"
                    }
                }
            }
        }
    }
}

日期的语法糖:

1.3:Exist

复制代码
# 1:删除老的,避免影响
DELETE /products
POST /products/_bulk
{"index": {"_id": 1}}
{"price":10,"available":true,"date":"2018-01-01","productID":"XHDK-A-1293-#fJ3"}
{"index": {"_id": 2}}
{"price":20,"available":true,"date":"2019-01-01","productID":"KDKE-B-9947-#kL5"}
{"index": {"_id": 3}}
{"price":30,"available":true,"productID":"JODL-X-1937-#pV7"}
{"index": {"_id": 4}}
{"price":30,"available":false,"productID":"QQPX-R-3956-#aD8"}

# 2:exists,必须包含date key并且有值才行(null和空字符串都不可以)
POST products/_search
{
    "query": {
        "constant_score": {
            "filter": {
                "exists": {
                    "field": "date"
                }
            }
        }
    }
}

1.4:多值字段

复制代码
# 1:删除老的,避免影响
DELETE movies
POST /movies/_bulk
{"index": {"_id": 1}}
{"title":"Father of the Bridge Part II","year":1995,"genre":"Comedy"}
{"index": {"_id": 2}}
{"title":"Dave","year":1993,"genre":["Comedy","Romance"]}

# 2:会查询出{"_id": 2}的数据,它是个数组,其实不应该查出来
POST movies/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": {
          "genre.keyword": "Comedy"
        }
      }
    }
  }
}

上述的查询,将"_id": 2}的数据的数据也查询出来了,其实这是不对的,是es对数组的实现机制导致了这个问题,该怎么办呢?

写在后面

其实结构化搜索的内容是包含在我们前面学习过的这篇文章 中的,只不过这里为了更加明确结构化的概念又进行了专门的的分析。

参考文章列表

ElasticSearch之search API

相关推荐
WordPress学习笔记12 小时前
wodpress结构化数据对SEO的作用
wordpress·结构化数据
wdfk_prog21 小时前
实战教程:从“对象文件为空“到仓库重生——修复 Git 仓库损坏全记录
大数据·网络·笔记·git·学习·elasticsearch·全文检索
Hello.Reader1 天前
以 Eland 玩转 Elasticsearch 8.12 Learning-to-Rank
大数据·elasticsearch·jenkins
ALex_zry1 天前
Git Status 命令深度指南:洞悉仓库状态的核心艺术
大数据·git·elasticsearch
ζั͡山 ั͡有扶苏 ั͡✾1 天前
Elasticsearch 单节点迁移实战指南:从旧服务器到新环境的完整流程
服务器·elasticsearch·jenkins
ALex_zry1 天前
Git 乱码文件处理全流程指南:从识别到彻底清除
git·elasticsearch·搜索引擎
Elasticsearch1 天前
无服务器日志分析由 Elasticsearch 提供支持,推出新的低价层
elasticsearch
麦兜*2 天前
Spring Boot集成方案 + Elasticsearch向量检索,语义搜索核弹
java·spring boot·python·spring·elasticsearch·spring cloud·系统架构
爱学习的小熊猫_2 天前
在Linux上部署RabbitMQ、Redis、ElasticSearch
linux·redis·elasticsearch·中间件·rabbitmq
用手手打人2 天前
SpringCloud -- elasticsearch(二)
大数据·elasticsearch·搜索引擎