Elasticsearch 搜索高亮功能及示例

在全文搜索中,高亮显示搜索关键字是一种常见的需求,它可以帮助用户快速定位到搜索词在文本中的位置。Elasticsearch 提供了强大的高亮功能,允许我们在搜索结果中突出显示匹配的文本片段。

高亮原理

Elasticsearch 的高亮功能通过在搜索结果中将关键字用特定的 HTML 标签标记出来实现。然后在前端页面中,可以给这些标签添加 CSS 样式,使其突出显示。

高亮语法

在 Elasticsearch 查询中,可以通过 highlight 参数来指定高亮的字段和一些高亮选项。基本语法如下:

json 复制代码
GET /index/_search
{
  "query": {
    "match": {
      "FIELD": "SEARCH_TERM"
    }
  },
  "highlight": {
    "fields": {
      "FIELD": {
        "pre_tags": ["<em>"],  // 标记高亮字段的前置标签
        "post_tags": ["</em>"]  // 标记高亮字段的后置标签
      }
    }
  }
}

高亮字段与搜索字段重合示例

当高亮字段与搜索字段一致时,即我们希望在搜索的字段上直接进行高亮显示。

示例

假设我们有一个 hotel 索引,其中 description 字段包含了酒店的描述信息,我们希望在搜索时高亮显示 description 字段中的关键字 "spa"。

json 复制代码
GET /hotel/_search
{
  "query": {
    "match": {
      "description": "spa"
    }
  },
  "highlight": {
    "fields": {
      "description": {
        "pre_tags": ["<em>"],
        "post_tags": ["</em>"]
      }
    }
  }
}

高亮字段与搜索字段不重合示例

当高亮字段与搜索字段不一致时,即我们希望在搜索的字段上进行高亮显示,但是高亮的字段是另一个字段。

示例

假设我们希望在 hotel 索引中搜索 name 字段中的 "如家",但是我们想在 description 字段上进行高亮显示。

json 复制代码
GET /hotel/_search
{
  "query": {
    "match": {
      "name": "如家"
    }
  },
  "highlight": {
    "fields": {
      "description": {
        "pre_tags": ["<em>"],
        "post_tags": ["</em>"],
        "require_field_match": false  // 允许高亮非搜索字段
      }
    }
  }
}

在这个例子中,我们使用了 require_field_match 设置为 false,这样即使 description 字段不是搜索字段,我们也可以在其上进行高亮显示。

结语

Elasticsearch 的搜索高亮功能极大地增强了搜索结果的可读性,帮助用户快速识别信息。通过合理配置高亮参数,我们可以在不同的字段上实现高亮效果,无论是在搜索字段上直接高亮,还是在其他字段上间接高亮。希望本文能帮助你更好地理解和使用 Elasticsearch 的搜索高亮功能。

相关推荐
万米商云1 小时前
企业物资集采平台解决方案:跨地域、多仓库、百部门——大型企业如何用一套系统管好百万级物资?
大数据·运维·人工智能
BigData共享1 小时前
极致性能背后的黑科技?这个世上没有“银弹”!(三)
大数据
阿里云大数据AI技术1 小时前
Flink Forward Asia 2025 主旨演讲精彩回顾
大数据·人工智能·flink
y_y_liang1 小时前
图生生AI商品换背景,高效商拍!
大数据·人工智能·ai·ai作画
王小王-1232 小时前
基于Hadoop的用户购物行为可视化分析系统设计与实现
大数据·hadoop·分布式·用户购物行为·电商日志分析
沐尘而生2 小时前
【AI智能体】智能音视频-硬件设备基于 WebSocket 实现语音交互
大数据·人工智能·websocket·机器学习·ai作画·音视频·娱乐
贝格前端工场2 小时前
小程序订阅消息设计:用户触达与隐私保护的平衡法则
大数据·小程序
成都极云科技3 小时前
成都算力租赁新趋势:H20 八卡服务器如何重塑 AI 产业格局?
大数据·服务器·人工智能·云计算·gpu算力
典学长编程4 小时前
高效学习之一篇搞定分布式管理系统Git !
大数据·git·搜索引擎
YFJ_mily6 小时前
2025第二届机电一体化、机器人与控制系统国际会议(MRCS2025)即将来袭
大数据·人工智能·机器人·机电一体化