把本地文件上传到HDFS上操作步骤

因为条件有限,我这里以虚拟机centos为例

实验条件:我在虚拟机上创建了三台节点,部署了hadoop,把笔记本上的数据上传到hdfs中

  1. 数据打包上传到虚拟机节点上
    采用的是rz命令,可以帮我们上传数据
    没有的话可以使用命令安装yum install lrzsz
bash 复制代码
[root@node04 0007]# rz
  1. 解压
    没有解压命令可以安装yum install unzip
bash 复制代码
[root@node04 data]# unzip 0007.zip
  1. 启动hads服务
bash 复制代码
[root@node04 data]# start-dfs.sh
  1. 查看hdfs下的目录结构
bash 复制代码
[root@node04 data]# hadoop dfs -ls /
  1. 在hdfs上为我们的数据创建目录
bash 复制代码
hadoop dfs -mkdir /data
  1. 把数据放到hdfs中
bash 复制代码
hadoop dfs -put /opt/data/0007/ /data/
  1. 查看结果
    存放成功
相关推荐
EasyCVR4 小时前
从汇聚到智能:解析视频融合平台EasyCVR视频智能分析技术背后的关键技术
大数据·人工智能
hqyjzsb6 小时前
2025文职转行AI管理岗:衔接型认证成为关键路径
大数据·c语言·人工智能·信息可视化·媒体·caie
sniper_fandc6 小时前
Elasticsearch从入门到进阶——分布式特性
大数据·分布式·elasticsearch
YangYang9YangYan7 小时前
大专计算机技术专业就业方向:解读、规划与提升指南
大数据·人工智能·数据分析
扫地的小何尚8 小时前
AI创新的火花:NVIDIA DGX Spark开箱与深度解析
大数据·人工智能·spark·llm·gpu·nvidia·dgx
B站_计算机毕业设计之家8 小时前
spark实战:python股票数据分析可视化系统 Flask框架 金融数据分析 Echarts可视化 大数据技术 ✅
大数据·爬虫·python·金融·数据分析·spark·股票
hzp6668 小时前
spark动态分区参数spark.sql.sources.partitionOverwriteMode
大数据·hive·分布式·spark·etl·partitionover
yumgpkpm12 小时前
CMP(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM),粉丝数超过200就开源下载
hive·hadoop·redis·mongodb·elasticsearch·hbase·big data
0和1的舞者13 小时前
《Git:从入门到精通(八)——企业级git开发相关内容》
大数据·开发语言·git·搜索引擎·全文检索·软件工程·初学者
运维行者_14 小时前
AWS云服务故障复盘——从故障中汲取的 IT 运维经验
大数据·linux·运维·服务器·人工智能·云计算·aws