Elasticsearch 使用问题记录

文章目录

Elasticsearch 使用问题记录

Text类型的字段,无法进行聚合和排序

  • 问题背景:在使用Elasticsearch的过程中,对Text类型的字段[conten]进行了聚合和排序的操作,如

    json 复制代码
    POST /my_index/_search
    {
    "size": 0,
    "aggs": {
        "terms_of_content": {
        "terms": {
            "field": "content"
        }
        }
    }
    }

    该index的mapping配置类似于

    json 复制代码
    "content" : {
          "type" : "text",
          "norms" : false,
          "analyzer" : "field_analyzer@content",
          "term_hash_enable" : true
        }
  • 报错信息

    java.lang.IllegalArgumentException: Text fields are not optimised for operations that require per-document field data like aggregations and sorting, so these operations are disabled by default. Please use a keyword field instead. Alternatively, set fielddata=true on [content] in order to load field data by uninverting the inverted index. Note that this can use significant memory.
    
  • 问题原因:Text类型的字段,一般用于全文搜索,进行了分词分析;而排序和聚合需要将整个字段内容都看做一个整体(token)来构建对应的索引,因此对于Text这种用于全文搜索的字段,Elasticsearch默认拒绝对其进行排序和聚合的操作

  • 解决办法

    1. 可以通过修改mapping,在字段中增加一个fields,设置为keyword类型
    json 复制代码
    "content" : {
            "type" : "text",
            "fields" : {
                "keyword" : {
                "type" : "keyword"
                }
            }
    1. 也可以参照错误提示在mapping中增加fielddata=true(不推荐,会占用大量内存)
    json 复制代码
     "content": {
       "type": "text",
       "fielddata": true
     }

高亮查询匹配过多,超出高亮默认限制

  • 问题背景:在查询过程中,查询条件添加了高亮,出现了报错

    查询语句

    json 复制代码
    POST /logs/_search
    {
    "query": {
        "match": {
        "message": "specific_error_code"
        }
    },
    "highlight": {
        "fields": {
        "request_arguments": {} // Highlighting is attempted on the request_arguments field
        }
    }
    }
  • 报错信息

    The length of [specific_error_code] field of [32535924] doc "illegal argument exception', maximum allowed to be analyzed for highlighting.
    
  • 问题原因:高亮查询的内容超出了highlight.max_analyzed_offset的设置,该配置的含义为高亮的最大字符,默认为[10000]

  • 解决办法:通过调大索引限制(有oom风险)/修改高亮搜索条件

    json 复制代码
      PUT index/_settings
      {
          "index" : {
              "highlight.max_analyzed_offset" : 100000000
          }
      }
    json 复制代码
    POST /logs/_search
    {
    "query": {
        "match": {
        "message": "specific_error_code"
        }
    },
    "highlight": {
        "fields": {
        "*": {}, // Highlight all other fields except the one causing the issue
        "request_arguments": {"no_match": "none"} // Exclude request_arguments from highlighting
        }
    }
    }
相关推荐
数据超市30 分钟前
全国现状建筑数据,选中范围即可查询下载,富含建筑物位置、层数、建筑物功能、名称地址等信息!
大数据·人工智能·信息可视化·数据挖掘·数据分析
LNTON羚通40 分钟前
视频监控业务平台LntonCVS国标视频综合管理平台功能及技术优势
大数据·网络·人工智能·算法·音视频
javaer炒粉1 小时前
Es结合springboot(笔记回忆)
spring boot·笔记·elasticsearch
阳爱铭2 小时前
深度分析 Apache Hudi:大数据实时处理的利器
大数据·数据库·数据仓库·分布式·apache·数据库开发·数据库架构
BlockOne112 小时前
TON、Solana 和 以太坊 2.0 的对比
大数据·人工智能·区块链
大霸王龙2 小时前
YOLO在目标检测与视频轨迹追踪中的应用
大数据·人工智能·python·yolo·目标检测·目标跟踪
Dxy12393102162 小时前
Elasticsearch优化索引映射和设置
大数据·elasticsearch·搜索引擎
Ftrans3 小时前
Outlook发送大文件的问题是什么?怎么解决?
大数据
LNTON羚通4 小时前
视频共享融合赋能平台LntonCVS统一视频接入平台数字化升级医疗体系
大数据·网络·人工智能·算法·音视频
深蓝易网9 小时前
制造企业的仓库管理如何做好数据分析?
大数据·运维·数据库·人工智能·数据挖掘·数据分析·制造