如何使用 INFINI Gateway 增量迁移 ES 数据

之前介绍过如何使用 INFINI Gateway迁移数据,但是迁移的是整个索引的全量数据。如果我只想迁移符合查询条件的数据,该怎么做呢?别小看这个需求,因为有了这个功能再结合时间条件检索,我们就能实现增量数据迁移,当然前提是数据有时间字段。

话不多说,我们来 demo 。

测试环境

|---------------|--------|
| 软件 | 版本 |
| Easysearch | 1.13.1 |
| Elasticsearch | 7.10.2 |
| Gateway | 1.29.8 |

迁移实战

迁移步骤与之前一样,只是 Gateway 配置里多了查询条件。

pipeline 部分我们增加 query_dsl 写入过滤条件。

复制代码
pipeline:
  - name: source_scroll
    auto_start: true
    keep_running: false
    processor:
      - es_scroll:
          slice_size: 1
          batch_size: 5000
          indices: "nginx"
          elasticsearch: source
          output_queue: source_index_dump
          partition_size: 1
          scroll_time: "5m"
          query_dsl: "{ \"query\": {  \"bool\": { \"filter\": [  {   \"range\": {  \"timestamp\": {   \"gte\": \"2024-11-16T23:59:50+08:00\",   \"lte\": \"2024-11-16T23:59:59+08:00\"  }   }  } ]  } }}"

我们先看看源端 nginx 索引全量数据有多少,297482 条。

再看看 nginx 索引中符合查询条件的文档有多少,21 条。

也就是说这次我们只会迁移 21 条数据,运行 Gateway 进行"增量"数据迁移。

迁移完成。结合查询条件可以使 INFINI Gateway 更加灵活,当然 Gateway 还有更多实用功能,欢迎大家查阅官方文档

相关推荐
科技互联.2 分钟前
2026年5月观察:四大头部工具如何重塑短视频矩阵的“生产规则”
大数据·人工智能·矩阵
2301_783848654 分钟前
如何在UI中高亮显示近三天更新过的数据行_时间差高亮规则
jvm·数据库·python
u01102251212 分钟前
JavaScript中Tree-shaking失效的场景及其优化对策
jvm·数据库·python
阿正呀17 分钟前
如何显著提升 Google Sheets 数据库批量更新脚本的执行效率
jvm·数据库·python
陆水A18 分钟前
运输时效预测模型:静态路由时效的计算与验证
大数据·人工智能·算法·spark·数据库开发·etl工程师
dFObBIMmai18 分钟前
MySQL迁移过程如何避免数据不一致_利用强一致性备份方案
jvm·数据库·python
u01102251224 分钟前
SQL如何利用聚合函数进行库存预测_历史数据分组汇总
jvm·数据库·python
2601_9577808431 分钟前
GPT-5.5时代:从“指令集“到“任务契约“的Prompt工程范式迁移
大数据·人工智能·gpt·架构·prompt
AC赳赳老秦38 分钟前
全链路自动化巡检:用 OpenClaw 实现服务器 - 应用 - 数据库全链路巡检,自动生成报告与整改建议
服务器·数据库·人工智能·深度学习·自动化·deepseek·openclaw
噢,我明白了43 分钟前
MySql数据库数据基础操作(增删改查)
数据库·mysql·增删改查