INFINI Gateway 助力联想集团 ES 迁移升级

近日接到联想公司小伙伴消息,因为安全原因需要把两套 ES 5 集群迁移升级到 ES 7 集群。我们一起梳理了需求和方案,决定采用 INFINI Console 加 INFINI Gateway 进行数据迁移,这个方案的好处如下:

  1. UI 界面操作,方便、快捷
  2. 支持目的端索引改名
  3. 支持复制源索引的 mapping 和 setting
  4. 对于大数据量的索引,可以 range 迁移,还可以 partition 分区。将大的迁移任务拆分成多个小任务,便于并发处理和错误重试
  5. 一键写入优化,为了加快迁移速度,可以一键给目标端索引设置写入优化参数
  6. 迁移时处理 type 问题,改成 _doc
  7. 集成了数据比对功能,增强迁移信心

当然,迁移过程中还遇到了一些其他问题:

  1. mapping.nested_fields.limit 超限,因为在 ES 5 中这个是不做限制的,在 ES 7 中默认限制 100000。导数前先修改,确保导入不报错。
  2. 有些数据中有"\n"特殊符号,导致 bulk 写入报错。这个提前让开发进行数据修复,去掉特殊字符。
  3. 报错"body size exceeds the given limit",修改 ES http.max_content_length 大小。

最后还有个问题,源端和目标端不在一个机房,对比数据因为 scroll 拉去数据不全,总是失败,怎么办?

哈哈,下次分解。

相关推荐
Elasticsearch1 天前
如何通过 Claude Code 来写入 CSV 数据到 Elasticsearch
elasticsearch
倔强的石头_1 天前
《Kingbase护城河》——数据库存储空间全景探测与精细化瘦身实战
数据库
冬奇Lab2 天前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
ClouGence2 天前
Oracle CDC 架构优化:从主库直连到 DataGuard 备库同步
数据库·后端·oracle
得物技术2 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子2 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据
无响应de神2 天前
三、用户与权限管理
数据库·mysql
大树883 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥1233 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
果丁智能3 天前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居