es 数据清理delete_by_query

bash 复制代码
POST /索引名/_delete_by_query?conflicts=proceed&scroll_size=2000&wait_for_completion=false&slices=36
{"size": 2000, 
  "query": {
    "bool": { 
      "must": [
        {
          "terms": {
              "rule_id": [
               800007
              ]
          }
      
        }
      ]
    }
  }
}

slices=36 一共的副本数量 主和副本总数。

scroll_size=2000 分批的数量。

conflicts=proceed 遇到版本冲突继续,

如果通过查询删除遇到版本冲突,将如何处理:终止或继续。默认为终止

wait_for_completion=false 放后台执行

通过调整这个两个参数控制性能和es压力

slices

scroll_size

查看后台任务id

bash 复制代码
GET _tasks?detailed=true&actions=*/delete/byquery&pretty

取消任务

bash 复制代码
POST /_tasks/ZGPDvWcgRXyuoWeiPFupcQ:23507301/_cancel

理论上删除数据以后后台会自动merge ,不用执行下面命令。

bash 复制代码
POST /index_name/_forcemerge?only_expunge_deletes=true

参考:

https://elasticsearch.bookhub.tech/rest_apis/document_apis/delete_by_query

https://www.elastic.org.cn/docs/8.1/www.elastic.co/guide/en/elasticsearch/reference/current/docs-delete-by-query.html

相关推荐
johnnyAndCode9 小时前
ES迁移工具,纯手搓,灵活好用效率高
大数据·elasticsearch·搜索引擎
予枫的编程笔记12 小时前
深度解析Kibana:从基础到进阶的全维度数据可视化指南
java·人工智能·elasticsearch·kibana
Galaxy~56712 小时前
Git常见命令及用法
大数据·git·elasticsearch
dessler12 小时前
Elasticsearch(ES)备份与快照(Snapshot)
大数据·elasticsearch·jenkins
CoderJia程序员甲12 小时前
Python连接和操作Elasticsearch详细指南
python·elasticsearch
铭毅天下13 小时前
投标环节:如何科学、合理地介绍 Elasticsearch 国产化替代方案——Easysearch?
大数据·elasticsearch·搜索引擎·全文检索
Elasticsearch13 小时前
使用 Elastic Agent Builder 和 MCP 实现 Agentic 参考架构
elasticsearch
yumgpkpm14 小时前
Cloudera CDH5、CDH6、CDP7现状及替代方案
数据库·人工智能·hive·hadoop·elasticsearch·数据挖掘·kafka
虫小宝14 小时前
天猫返利app搜索系统优化:基于Elasticsearch的商品导购引擎设计
大数据·elasticsearch·搜索引擎
h***381815 小时前
Java进阶(ElasticSearch的安装与使用)
java·elasticsearch·jenkins