Hadoop初体验

一、HDFS初体验

1. shell命令操作

hadoop fs -mkdir /itcast

hadoop fs -put zookeeper.out /itcast

hadoop fs -ls /

2. Web UI页面操作

结论:

  1. HDFS本质就是一个文件系统
  2. 有目录树结构 和Linux类似,分文件、文件夹
  3. 为什么上传一个小文件也这么慢?

二、MapReduce +YARN初体验

执行Hadoop官方自带的MapReduce案例

评估圆周率π的值

cd /export/server/hadoop-3.1.4/share/hadoop/mapreduce/

hadoop jar hadoop-mapreduce-examples-3.1.4.jar pi 2 4

思考:

  1. MapReduce本质是程序?
  2. 执行MapReduce的时候,为什么首先请求YARN?
  3. MapReduce看上去好像是两个阶段?
  4. 先Map,再Reduce?
  5. 处理小数据的时候,MapReduce速度快吗?
相关推荐
@十八子德月生1 小时前
8天Python从入门到精通【itheima】-1~5
大数据·开发语言·python·学习
元6331 小时前
Hadoop集群的常用命令
大数据·hadoop
武汉格发Gofartlic3 小时前
FEKO许可证的安全与合规性
大数据·运维·安全
姬激薄3 小时前
HDFS概述
大数据·hadoop·hdfs
依年南台3 小时前
克隆虚拟机组成集群
大数据·hadoop
依年南台4 小时前
搭建大数据学习的平台
大数据·学习
张人玉5 小时前
数据可视化大屏——物流大数据服务平台(二)
大数据·信息可视化
Leo.yuan6 小时前
数据分析怎么做?高效的数据分析方法有哪些?
大数据·数据库·信息可视化·数据挖掘·数据分析
杜清卿7 小时前
Spark处理过程-转换算子和行动算子
大数据·分布式·spark
小冻梨!!!8 小时前
Spark,在shell中运行RDD程序
大数据·javascript·spark