es 数据清理delete_by_query

bash 复制代码
POST /索引名/_delete_by_query?conflicts=proceed&scroll_size=2000&wait_for_completion=false&slices=36
{"size": 2000, 
  "query": {
    "bool": { 
      "must": [
        {
          "terms": {
              "rule_id": [
               800007
              ]
          }
      
        }
      ]
    }
  }
}

slices=36 一共的副本数量 主和副本总数。

scroll_size=2000 分批的数量。

conflicts=proceed 遇到版本冲突继续,

如果通过查询删除遇到版本冲突,将如何处理:终止或继续。默认为终止

wait_for_completion=false 放后台执行

通过调整这个两个参数控制性能和es压力

slices

scroll_size

查看后台任务id

bash 复制代码
GET _tasks?detailed=true&actions=*/delete/byquery&pretty

取消任务

bash 复制代码
POST /_tasks/ZGPDvWcgRXyuoWeiPFupcQ:23507301/_cancel

理论上删除数据以后后台会自动merge ,不用执行下面命令。

bash 复制代码
POST /index_name/_forcemerge?only_expunge_deletes=true

参考:

https://elasticsearch.bookhub.tech/rest_apis/document_apis/delete_by_query

https://www.elastic.org.cn/docs/8.1/www.elastic.co/guide/en/elasticsearch/reference/current/docs-delete-by-query.html

相关推荐
張萠飛4 小时前
Linux下如何使用shell脚本导出elasticsearch中某一个index的数据为本地csv文件
linux·运维·elasticsearch
LanLance6 小时前
ES101系列09 | 运维、监控与性能优化
java·运维·后端·elasticsearch·云原生·性能优化·golang
疯狂的沙粒9 小时前
如何通过git命令查看项目连接的仓库地址?
大数据·git·elasticsearch
IT成长日记13 小时前
Elasticsearch集群手动分片分配指南:原理与实践
大数据·elasticsearch·手动分片分配
Elastic 中国社区官方博客1 天前
Elastic 获得 AWS 教育 ISV 合作伙伴资质,进一步增强教育解决方案产品组合
大数据·人工智能·elasticsearch·搜索引擎·云计算·全文检索·aws
Tom Boom1 天前
Git常用命令完全指南:从入门到精通
大数据·git·elasticsearch·docker·自动化测试框架
星星点点洲1 天前
【Elasticsearch】 查询优化方式
elasticsearch·搜索引擎
@BreCaspian1 天前
Git 推送失败解决教程——error: failed to push some refs to
大数据·git·elasticsearch
Elasticsearch1 天前
节省 90% 存储!源码级揭秘腾讯云 ES 向量搜索的优化之道
elasticsearch
鱼儿也有烦恼1 天前
Elasticsearch最新入门教程
java·elasticsearch·kibana