Hadoop数据迁移distcp

Hadoop数据迁移distcp

准备工作

  1. 确认源集群(a),目标集群(b)
  2. 确认a集群的主节点和b集群的主节点
  3. 确认两个集群的网络相通
  4. 确认迁移模式(全量迁移还是增量迁移),这里选择全量迁移

迁移文件

  1. 迁移test目录下的文件至目标目录下
    命令:hadoop distcp -p -m 并行度 -bandwidth 带宽 源目录 目标目录
    示例:
bash 复制代码
hadoop distcp -p -m 5 -bandwidth 10 hdfs://源master:8020/test /

注意:源master为主namenode;命令行在目标主namenode上执行。

相关推荐
Hello.Reader18 分钟前
Flink Savepoint 可控升级、可回滚、可分叉的“状态快照”
大数据·flink
Elastic 中国社区官方博客19 分钟前
Elasticsearch 用于词形还原的开源 Hebrew 分析器
大数据·elasticsearch·搜索引擎·ai·开源·全文检索·中文分词
Francek Chen26 分钟前
【大数据存储与管理】分布式文件系统HDFS:03 HDFS的相关概念
大数据·hadoop·分布式·hdfs
链上日记44 分钟前
WEEX 2025年度报告
大数据·人工智能·区块链
盟接之桥44 分钟前
盟接之桥说制造:制造业的精致之道,致制造人
大数据·linux·运维·人工智能·windows·安全·制造
geneculture1 小时前
双语思维视域下54个学习理论的时间谱系与认知透视:一种基于感性语言与理性语言互动的学习理论重构
大数据·人工智能·机器学习·知识图谱·融智学应用场景·融智时代(杂志)
是做服装的同学11 小时前
服装软件ERP管理系统实现智能化流程管控与业务协同
大数据·经验分享·其他
Sinosecu-OCR13 小时前
释放数字化力量:智能OCR识别如何重塑现代办公效率
大数据·人工智能
humors22115 小时前
【分享】传统文化/国学/圣贤视频
大数据·程序人生
新缸中之脑17 小时前
Graphlit: AI代理的上下文图层
大数据·人工智能