es 数据清理delete_by_query

bash 复制代码
POST /索引名/_delete_by_query?conflicts=proceed&scroll_size=2000&wait_for_completion=false&slices=36
{"size": 2000, 
  "query": {
    "bool": { 
      "must": [
        {
          "terms": {
              "rule_id": [
               800007
              ]
          }
      
        }
      ]
    }
  }
}

slices=36 一共的副本数量 主和副本总数。

scroll_size=2000 分批的数量。

conflicts=proceed 遇到版本冲突继续,

如果通过查询删除遇到版本冲突,将如何处理:终止或继续。默认为终止

wait_for_completion=false 放后台执行

通过调整这个两个参数控制性能和es压力

slices

scroll_size

查看后台任务id

bash 复制代码
GET _tasks?detailed=true&actions=*/delete/byquery&pretty

取消任务

bash 复制代码
POST /_tasks/ZGPDvWcgRXyuoWeiPFupcQ:23507301/_cancel

理论上删除数据以后后台会自动merge ,不用执行下面命令。

bash 复制代码
POST /index_name/_forcemerge?only_expunge_deletes=true

参考:

https://elasticsearch.bookhub.tech/rest_apis/document_apis/delete_by_query

https://www.elastic.org.cn/docs/8.1/www.elastic.co/guide/en/elasticsearch/reference/current/docs-delete-by-query.html

相关推荐
斯特凡今天也很帅12 小时前
Elasticsearch数据库专栏(一)Kinaba的基础使用
elasticsearch·kibana
不爱吃糖的程序媛18 小时前
鸿蒙三方库适配读懂 `thirdparty/AES/.gitignore`:哪些文件不该进 Git?
git·elasticsearch·harmonyos
A__tao18 小时前
一键实现 SQL → ES Mapping 转换,支持自定义 `text` 为 `json` 转换
sql·elasticsearch·json
ShawnLiaoking1 天前
pycharm 上传更新代码
ide·elasticsearch·pycharm
果粒蹬i1 天前
Elasticsearch 单机部署实测:安装流程、常见坑点与远程访问配置
大数据·elasticsearch·搜索引擎
AC赳赳老秦1 天前
OpenClaw数据库高效操作指南:MySQL/PostgreSQL批量处理与数据迁移实战
大数据·数据库·mysql·elasticsearch·postgresql·deepseek·openclaw
历程里程碑1 天前
二叉树---二叉树的中序遍历
java·大数据·开发语言·elasticsearch·链表·搜索引擎·lua
Elastic 中国社区官方博客2 天前
使用 Elasticsearch + Jina embeddings 进行无监督文档聚类
大数据·人工智能·elasticsearch·搜索引擎·全文检索·jina
ACGkaka_2 天前
ES 学习(九)从文本到词元:分词器如何“拆解“你的数据
大数据·学习·elasticsearch
Elastic 中国社区官方博客2 天前
如何使用 LogsDB 降低 Elasticsearch 日志存储成本
大数据·运维·数据库·elasticsearch·搜索引擎·全文检索·可用性测试