ElasticSearch查询指南:从青铜到王者的骚操作

ElasticSearch查询指南:从青铜到王者的骚操作

本文来源于笔者的CSDN原创,由于掘金>已经去掉了转载功能,所以只好重新上传,以下图片依然保持最初发布的水印(如CSDN水印)。(以后属于本人原创均以新建状态在多个平台分享发布)

第一章 倒排索引:ES的"新华字典"制作指南

1.1 反向操作的艺术

想象你有一本菜谱,但目录是按食材排列的:

  • 🥚鸡蛋 → [番茄炒蛋 P12, 蛋花汤 P45]
  • 🍅番茄 → [番茄炒蛋 P12, 罗宋汤 P33]

索引实战三部曲

json 复制代码
PUT /cookbook/_doc/1
{
  "title": "深夜食堂之黯然销魂饭",
  "ingredients": ["叉烧", "温泉蛋", "葱花"],
  "steps": "将叉烧切成..." 
}

GET /cookbook/_search
{
  "query": {
    "match": { "ingredients": "温泉蛋 叉烧" }
  }
}

第二章 DSL语法:搜索界的乐高积木

2.1 万能bool查询:相亲条件排列组合

复制代码
{
  "query": {
    "bool": {
      "must": [   // 必须满足
        { "term": { "gender": "女" } },
        { "range": { "age": { "gte": 25 } } }
      ],
      "should": [  // 满足更好
        { "term": { "hasPet": "布偶猫" } },
        { "match": { "hobby": "滑雪 潜水" } }
      ],
      "must_not": { // 绝对不要
        "term": { "character": "妈宝男" }
      },
      "filter": [  // 精确筛选
        { "geo_distance": { "distance": "10km", "location": "陆家嘴" } }
      ]
    }
  }
}

2.2 查询全家桶套餐

查询类型 使用场景 相当于相亲中的...
term 精准匹配 "必须本地户口!"
match 语义分析 "三观合得来就行"
match_phrase 词组匹配 "要求'上海交大毕业'"
range 范围筛选 "身高175cm以上"

第三章 高阶操作:搜索结果的精装修

3.1 分页的陷阱与救赎

复制代码
// 基础分页(小数据量适用)
{
  "from": 100,
  "size": 10,
  "query": { "match_all": {} }
}

// 深度分页正确姿势
{
  "size": 10,
  "sort": [
    { "timestamp": "desc" },
    { "_id": "asc" }
  ],
  "search_after": [1625000000, "abc123"]
}

3.2 排序的七十二变

复制代码
// 多维度排序示例
{
  "sort": [
    { "price": { "order": "asc" } },  // 优先便宜货
    { "sales": { "order": "desc" } },  // 其次销量王
    { "_score": { "order": "desc" } } // 最后匹配度
  ]
}

第四章 实战演练:电商搜索系统改造记

4.1 索引定义:给商品打标签

复制代码
PUT /ecommerce
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "ik_max_word",
        "fields": {
          "keyword": { "type": "keyword" }
        }
      },
      "price": { "type": "double" },
      "category": { "type": "keyword" },
      "tags": { "type": "nested" }
    }
  }
}

4.2 综合查询:找性价比之王

复制代码
GET /ecommerce/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "title": "无线耳机" } }
      ],
      "filter": [
        { "range": { "price": { "gte": 199, "lte": 599 } } },
        { "term": { "category": "数码配件" } }
      ],
      "should": [
        { "term": { "tags": "七天无理由退货" } },
        { "term": { "tags": "旗舰店" } }
      ]
    }
  },
  "sort": [
    { "rating": { "order": "desc" } },
    { "price": { "order": "asc" } }
  ],
  "from": 0,
  "size": 20
}

结果分析技巧

复制代码
{
  "took": 48,             // 查询耗时48ms
  "hits": {
    "total": { "value": 82 },  // 共82件商品符合
    "max_score": null,
    "hits": [
      {
        "_score": 12.345,
        "_source": {
          "title": "【旗舰店】Beats无线降噪耳机",
          "price": 499.00,
          "rating": 4.8
        },
        "sort": [4.8, 499.0]  // 排序字段值
      }
    ]
  }
}

第五章 避坑宝典:来自ES老司机的忠告

5.1 中文分词惨案现场

错误示范:

复制代码
{ "term": { "title": "小米手机" } } // 永远搜不到!

正确姿势:

复制代码
{ "match": { "title": "小米手机" } } // 自动分词搜索

// 精确匹配需用keyword
{ "term": { "title.keyword": "小米手机" } }

5.2 性能优化三板斧

  1. 索引设计防脱发

    PUT /logs-2023-08
    {
    "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 1
    }
    }

  2. 批量操作保平安

    错误示范:循环单条插入

    for data in dataset:
    es.index(data)

    正确姿势:批量操作

    from elasticsearch.helpers import bulk
    bulk(es, ({"_index":"logs","_source":data} for data in dataset))

  3. 冷热数据分离术

    Hot节点(NVMe SSD) ←→ Warm节点(SATA SSD) ←→ Cold节点(HDD归档)


ES生存法则

遇到性能问题先看日志,再看内存,最后默念三遍"分片设置合理吗?"

查询DSL就像搭积木,多摔几次就熟练了~

记住:永远不要在凌晨3点修改生产环境的Mapping!😱

相关推荐
青云交3 小时前
Java 大视界 -- Java 大数据在智能安防人脸识别系统中的活体检测与防伪技术应用
java·大数据·生成对抗网络·人脸识别·智能安防·防伪技术·活体测试
chenglin0163 小时前
ES_索引模板
大数据·elasticsearch·jenkins
byte轻骑兵5 小时前
大数据时代时序数据库选型指南:深度解析与 Apache IoTDB 实践
大数据·apache·时序数据库
NPE~6 小时前
[docker/大数据]Spark快速入门
大数据·分布式·docker·spark·教程
的小姐姐7 小时前
AI与IIOT如何重新定义设备维护系统?_璞华大数据Hawkeye平台
大数据·人工智能
TDengine (老段)8 小时前
TDengine IDMP 最佳实践
大数据·数据库·物联网·ai·时序数据库·tdengine·涛思数据
彬彬醤8 小时前
Mac怎么连接VPS?可以参考这几种方法
大数据·运维·服务器·数据库·线性代数·macos·矩阵
星域智链9 小时前
车载 GPS 与手机导航的终极对决:谁在复杂路况下更胜一筹?
大数据·科技·ai
MaxCode-110 小时前
单智能体篇:Prompt工程艺术
大数据·人工智能·prompt
Elasticsearch11 小时前
传统 AI 与生成式 AI:IT 领导者指南
elasticsearch