INFINI Gateway 助力联想集团 ES 迁移升级

近日接到联想公司小伙伴消息,因为安全原因需要把两套 ES 5 集群迁移升级到 ES 7 集群。我们一起梳理了需求和方案,决定采用 INFINI Console 加 INFINI Gateway 进行数据迁移,这个方案的好处如下:

  1. UI 界面操作,方便、快捷
  2. 支持目的端索引改名
  3. 支持复制源索引的 mapping 和 setting
  4. 对于大数据量的索引,可以 range 迁移,还可以 partition 分区。将大的迁移任务拆分成多个小任务,便于并发处理和错误重试
  5. 一键写入优化,为了加快迁移速度,可以一键给目标端索引设置写入优化参数
  6. 迁移时处理 type 问题,改成 _doc
  7. 集成了数据比对功能,增强迁移信心

当然,迁移过程中还遇到了一些其他问题:

  1. mapping.nested_fields.limit 超限,因为在 ES 5 中这个是不做限制的,在 ES 7 中默认限制 100000。导数前先修改,确保导入不报错。
  2. 有些数据中有"\n"特殊符号,导致 bulk 写入报错。这个提前让开发进行数据修复,去掉特殊字符。
  3. 报错"body size exceeds the given limit",修改 ES http.max_content_length 大小。

最后还有个问题,源端和目标端不在一个机房,对比数据因为 scroll 拉去数据不全,总是失败,怎么办?

哈哈,下次分解。

相关推荐
武子康1 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天1 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
Elasticsearch2 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
jiayou642 天前
KingbaseES 实战:深度解析数据库对象访问权限管理
数据库
李广坤3 天前
MySQL 大表字段变更实践(改名 + 改类型 + 改长度)
数据库
Elasticsearch3 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
爱可生开源社区4 天前
2026 年,优秀的 DBA 需要具备哪些素质?
数据库·人工智能·dba
随逸1774 天前
《从零搭建NestJS项目》
数据库·typescript
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive