elasticsearch低频字段优化

在Elasticsearch中,通过设置"index": false关闭低频字段的倒排索引构建是常见的优化手段,以下是关键要点:

一、核心机制

‌倒排索引禁用‌

设置index: false后,字段不会生成倒排索引,无法通过常规查询(如match、term)检索该字段。但字段值仍会存储在_source中,可通过返回原始数据获取。‌特殊字段类型的例外‌数值、日期、布尔等类型字段即使设置index: false,仍可能通过doc_values实现排序和聚合。

二、适用场景

‌ 低频访问字段‌:如日志中的辅助信息、冗余元数据等无需搜索的字段。

‌存储优化‌:减少索引体积,提升写入速度(尤其适用于高频写入场景)。

三、配置示例

定义Mapping时显式关闭索引:

复制代码
PUT my_index
{
  "mappings": {
    "properties": {
      "metadata": {
        "type": "text",
        "index": false  // 禁止构建倒排索引
      }
    }
  }
}

四、注意事项

‌查询限制‌:禁用索引后,直接查询该字段会返回空结果。

‌性能权衡‌:需评估字段的实际使用需求,避免误关闭高频查询字段。

若需彻底禁用字段存储,需同步设置"enabled": false。

相关推荐
武子康11 分钟前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
洛森唛20 小时前
ElasticSearch查询语句Query String详解:从入门到精通
后端·elasticsearch
字节跳动数据平台21 小时前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康1 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
洛森唛2 天前
Elasticsearch DSL 查询语法大全:从入门到精通
后端·elasticsearch
字节跳动数据平台2 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术2 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康2 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康3 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天3 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink