Hadoop数据迁移distcp

Hadoop数据迁移distcp

准备工作

  1. 确认源集群(a),目标集群(b)
  2. 确认a集群的主节点和b集群的主节点
  3. 确认两个集群的网络相通
  4. 确认迁移模式(全量迁移还是增量迁移),这里选择全量迁移

迁移文件

  1. 迁移test目录下的文件至目标目录下
    命令:hadoop distcp -p -m 并行度 -bandwidth 带宽 源目录 目标目录
    示例:
bash 复制代码
hadoop distcp -p -m 5 -bandwidth 10 hdfs://源master:8020/test /

注意:源master为主namenode;命令行在目标主namenode上执行。

相关推荐
talen_hx29611 分钟前
《零基础入门Spark》学习笔记 Day 10
大数据·hive·笔记·学习·spark
源码之家11 分钟前
计算机毕业设计:汽车数据可视化分析系统 Django框架 Scrapy爬虫 可视化 数据分析 大数据 大模型 机器学习(建议收藏)✅
大数据·python·信息可视化·flask·汽车·课程设计·美食
二进制_博客12 分钟前
Spark On Hive 系统整合
大数据·hive·spark
D愿你归来仍是少年13 分钟前
Apache Flink 学习笔记 · Phase 1
大数据·flink·apache
白眼黑刺猬14 分钟前
真实面试:大数据开发岗
大数据·面试·职场和发展
D愿你归来仍是少年15 分钟前
Apache Spark 第 13 章:Real-Time Mode 实时计算
大数据·spark·apache
源码之家16 分钟前
计算机毕业设计:基于Python的二手车数据分析可视化系统 Flask框架 可视化 时间序列预测算法 逻辑回归 requests 爬虫 大数据(建议收藏)✅
大数据·hadoop·python·算法·数据分析·flask·课程设计
昨夜见军贴061616 分钟前
AI报告文档审核赋能数据不出域:IACheck重构机械制造行业本地化质量管控体系
大数据·人工智能·重构
炜宏资料库18 分钟前
华为五级流程体系(L1-L5) 、流程框架、实施方法与最佳实践108页PPT
大数据·华为
源码之屋34 分钟前
计算机毕业设计:新能源汽车多维度数据分析系统 Django框架 Scrapy爬虫 可视化 数据分析 大数据 大模型 机器学习(建议收藏)✅
大数据·python·scrapy·django·汽车·课程设计·美食