如何使用 INFINI Gateway 增量迁移 ES 数据

之前介绍过如何使用 INFINI Gateway迁移数据,但是迁移的是整个索引的全量数据。如果我只想迁移符合查询条件的数据,该怎么做呢?别小看这个需求,因为有了这个功能再结合时间条件检索,我们就能实现增量数据迁移,当然前提是数据有时间字段。

话不多说,我们来 demo 。

测试环境

|---------------|--------|
| 软件 | 版本 |
| Easysearch | 1.13.1 |
| Elasticsearch | 7.10.2 |
| Gateway | 1.29.8 |

迁移实战

迁移步骤与之前一样,只是 Gateway 配置里多了查询条件。

pipeline 部分我们增加 query_dsl 写入过滤条件。

复制代码
pipeline:
  - name: source_scroll
    auto_start: true
    keep_running: false
    processor:
      - es_scroll:
          slice_size: 1
          batch_size: 5000
          indices: "nginx"
          elasticsearch: source
          output_queue: source_index_dump
          partition_size: 1
          scroll_time: "5m"
          query_dsl: "{ \"query\": {  \"bool\": { \"filter\": [  {   \"range\": {  \"timestamp\": {   \"gte\": \"2024-11-16T23:59:50+08:00\",   \"lte\": \"2024-11-16T23:59:59+08:00\"  }   }  } ]  } }}"

我们先看看源端 nginx 索引全量数据有多少,297482 条。

再看看 nginx 索引中符合查询条件的文档有多少,21 条。

也就是说这次我们只会迁移 21 条数据,运行 Gateway 进行"增量"数据迁移。

迁移完成。结合查询条件可以使 INFINI Gateway 更加灵活,当然 Gateway 还有更多实用功能,欢迎大家查阅官方文档

相关推荐
旺仔Sec1 天前
2025年安徽省职业院校技能大赛(中职组)大数据应用与服务赛项样题
大数据
SAP小崔说事儿1 天前
在数据库中将字符串拆分成表单(SQL和HANA版本)
java·数据库·sql·sap·hana·字符串拆分·无锡sap
ctrigger1 天前
中级统计师《统计基础理论及相关》考试大纲
大数据
做cv的小昊1 天前
【TJU】信息检索与分析课程笔记和练习(1)认识文献
经验分享·笔记·学习·搜索引擎·全文检索
川贝枇杷膏cbppg1 天前
asmcmd
数据库·oracle
JIngJaneIL1 天前
基于java+ vue助农电商系统(源码+数据库+文档)
java·开发语言·前端·数据库·vue.js·spring boot·后端
SmartBrain1 天前
洞察:阿里通义DeepResearch 技术
大数据·人工智能·语言模型·架构
IndulgeCui1 天前
基于CentOS7 DM8单机部署配置记录-20251216
数据库
surtr11 天前
关系代数与关系型数据库
数据库·sql·数据库系统
学海_无涯_苦作舟1 天前
MySQL面试题
数据库·mysql·面试