Hadoop数据迁移distcp

Hadoop数据迁移distcp

准备工作

  1. 确认源集群(a),目标集群(b)
  2. 确认a集群的主节点和b集群的主节点
  3. 确认两个集群的网络相通
  4. 确认迁移模式(全量迁移还是增量迁移),这里选择全量迁移

迁移文件

  1. 迁移test目录下的文件至目标目录下
    命令:hadoop distcp -p -m 并行度 -bandwidth 带宽 源目录 目标目录
    示例:
bash 复制代码
hadoop distcp -p -m 5 -bandwidth 10 hdfs://源master:8020/test /

注意:源master为主namenode;命令行在目标主namenode上执行。

相关推荐
lifallen22 分钟前
一篇文章讲透 Flink State
大数据·数据库·python·flink
AI先驱体验官41 分钟前
臻灵:数字人形象驱动新突破,NVIDIA开源PersonaPlex带来的技术变局
大数据·人工智能·深度学习·重构·开源·aigc
鸿蒙程序媛1 小时前
【工具汇总】git 常用命令行汇总
大数据·git·elasticsearch
人工智能培训1 小时前
如何将高层任务分解为可执行的动作序列?
大数据·人工智能·算法·机器学习·知识图谱
Project_Observer1 小时前
列表视图中的筛选列
大数据·数据库·深度学习·机器学习·深度优先
紧固视界1 小时前
汽车紧固件最新技术趋势解析:2026上海紧固件专业展有哪些看点
大数据·人工智能·汽车·紧固件·上海紧固件展·上海紧固件专业展
刘佬GEO1 小时前
本地门店做 GEO 的起步顺序:第一步先做什么?
大数据·网络·人工智能·搜索引擎·ai
上海蓝色星球1 小时前
流程标准化・作业一体化|蓝色星球造价机器人,以全流程线上化破解造价咨询管理困局
大数据·人工智能
marteker2 小时前
哈雷戴维森在推出增长战略前重塑品牌形象
大数据·人工智能
歪歪歪比巴卜2 小时前
2026年AI新媒体运营工具怎么选?核心功能与适用场景解析
大数据·矩阵·新媒体运营