Elasticsearch中的基本全文搜索和过滤

Elasticsearch中的基本全文搜索和过滤

知识点参考:https://www.elastic.co/guide/en/elasticsearch/reference/current/full-text-filter-tutorial.html#full-text-filter-tutorial-range-query


1. 索引设计与映射

  • 多字段类型(Multi-Fields)

    • 文本字段默认映射为text(全文搜索)和keyword(精确过滤)子字段。
    • 示例:title字段同时支持全文搜索(title)和精确过滤(title.keyword)。
    • 作用:兼顾灵活搜索与高效过滤。
  • 字段类型选择

    • text:用于全文检索(如标题、描述)。
    • keyword:用于精确匹配或聚合(如分类、标签)。
    • date:日期类型(指定格式yyyy-MM-dd)。
    • float:浮点数(如评分rating)。
  • 分析器(Analyzer)

    • 默认使用standard分析器(分词、转小写、去停用词)。
    • 影响索引和搜索时的文本处理逻辑。

2. 全文搜索技术

  • **match​查询**:

    • 基础全文搜索,默认OR​逻辑匹配分词后的词项。

    • 支持参数:

      • operator:切换AND逻辑(需所有词项匹配)。
      • minimum_should_match:控制最少匹配词项数(如2/3)。
  • **multi_match​查询**:

    • 跨多字段搜索(如同时搜索titledescriptiontags)。
    • 字段加权 :通过^符号提升字段权重(如title^3)。
    • 示例:优先匹配标题中的关键词。

3. 精确过滤方法

  • **term​查询**:

    • 精确匹配未经分析的字段值(必须使用.keyword子字段)。
    • 示例:{"term": {"category.keyword": "Breakfast"}}
  • **range​查询**:

    • 数值或日期范围过滤。
    • 参数:gte(≥)、lte(≤)、gt(>)、lt(<)。
    • 示例:过滤评分≥4.5的食谱。

4. 组合查询(Bool Query)

  • 逻辑子句

    • must:所有条件必须满足(贡献相关性得分)。
    • should:至少满足一个条件(提升得分)。
    • must_not:排除匹配条件(不贡献得分)。
    • filter:过滤条件(不计算得分,性能优化)。
  • 典型场景

    • 必须包含vegetarian标签 + 评分≥4.5 + 非甜点类别。
    • 示例:复合过滤与搜索条件组合。

5. 性能优化与最佳实践

  • 过滤优于查询

    • 使用filter上下文避免相关性计算,提升性能。
  • 字段设计规范

    • ignore_above:限制keyword字段长度(默认256字符)。
    • 避免长文本使用keyword类型(节省存储)。
  • 分析器选择

    • 根据业务需求定制(如中文需ik分词器)。

6. 高级应用方向

  • 相关性调优

    • 使用function_score自定义评分公式。
    • 字段长度归一化(norms参数)。
  • 近似匹配

    • match_phrase(短语匹配)。
    • fuzzy查询(容错拼写)。
  • 聚合分析(Aggregations)

    • 统计分类分布、评分分布等。

关键命令速查

bash 复制代码
# 创建索引
PUT /cooking_blog

# 批量导入数据
POST /cooking_blog/_bulk?refresh=wait_for

# 基本全文搜索
GET /_search { "match": { "description": "fluffy pancakes" } }

# 多字段加权搜索
GET /_search { "multi_match": { "query": "curry", "fields": ["title^3", "description"] } }

# 复合布尔查询
GET /_search { "bool": { "must": [...], "should": [...] } }

掌握这些知识点可快速实现 精准搜索+高效过滤 的复杂需求,适用于电商、内容平台、日志分析等场景.

相关推荐
一点事1 天前
windows:ELK搭建(单机)
windows·elk·jenkins
没有bug.的程序员3 天前
Spring Boot 日志管理:从 Logback 深度配置到 ELK 万亿级日志中枢实战
java·spring boot·elk·logback·日志·管理
橙露4 天前
日志分析与监控:ELK栈(Elasticsearch+Logstash+Kibana)搭建全流程指南
大数据·elk·elasticsearch
信创天地6 天前
国产化数据库深度运维:性能调优与故障排查实战指南
运维·数据库·安全·elk·自动化·rabbitmq
yangminlei9 天前
Elasticsearch 全面解析:从原理到实战的分布式搜索引擎指南
java·elk
我爱娃哈哈9 天前
SpringBoot + ELK + MDC:分布式系统日志追踪,快速定位跨服务调用链问题
spring boot·后端·elk
信创天地11 天前
信创环境下数据库与中间件监控实战:指标采集、工具应用与告警体系构建
java·运维·数据库·安全·elk·华为·中间件
信创天地12 天前
信创日志全流程管控:ELK国产化版本与华为日志服务实战应用
运维·安全·elk·华为·rabbitmq·dubbo
三不原则16 天前
实战:ELK 分析 AI 系统日志,快速定位接口报错问题
人工智能·elk
BullSmall16 天前
ELK 单机版日志系统【一键自动化部署脚本 + 完整配套配置】
运维·elk·自动化