一.创建与查看HDFS目录
每次重启后,Jps和java -version执行出来的结果不符合就使用
`source ~/.bash_profile` 是在 Unix/Linux 系统上用来重新加载用户的 Bash 配置文件 `~/.bash_profile` 的命令。这条命令的作用是使得当前的 Bash 环境重新读取并应用 `~/.bash_profile` 中的设置和变量定义。
首先检查master0、slave0虚拟机网络和java版本("1.7.0_71"),检查后再启动hadoop
[csu@master0 ~]$ cd ~/hadoop-2.6.0
[csu@master0 hadoop-2.6.0]$ sbin/start-all.sh (启动)
[csu@master0 hadoop-2.6.0]$ sbin/stop-all.sh (关闭)
再检查是否启动成功
data:image/s3,"s3://crabby-images/0b3f0/0b3f038448d4f89b94bdefa87abc9839548a4371" alt=""
data:image/s3,"s3://crabby-images/7d9d6/7d9d62d50c61adec03292e41b153f3a11c298d6b" alt=""
data:image/s3,"s3://crabby-images/994be/994be7032f75eb314a3597ab0c9a5569f7b6577e" alt=""
data:image/s3,"s3://crabby-images/4c539/4c5399894570dc988d0fc4b445b091d749a4f32d" alt=""
data:image/s3,"s3://crabby-images/47567/47567c1068bcbb841513b7d070904394b28f0104" alt=""
data:image/s3,"s3://crabby-images/c9823/c98238aedb06a322dfc5035ac22bb4736e04e205" alt=""
data:image/s3,"s3://crabby-images/bae34/bae34d421eb55a5a9d2421f512de79504c0fb94c" alt=""
1、创建HDFS目录:
-p可以递归创建
data:image/s3,"s3://crabby-images/a043c/a043ccacf02a8a8e765207b72291e94c36cee010" alt=""
2、查看之前创建的HDFS目录
data:image/s3,"s3://crabby-images/17392/17392b3f55ab5f6de02e8306a599d34397eb03e3" alt=""
注意:因为登录的用户为csu,所以会显示/user/csu下的目录。
3、查看HDFS完整目录
因为hadoop fs -ls只能查看一级目录,所以必须逐级查看:
data:image/s3,"s3://crabby-images/9b0ef/9b0ef621da2d1ecc7896039da03dd84bc38f8848" alt=""
4、查看所有的HDFS子目录
HDFS提供了一个方便的选项 -R 可以递归查看目录
data:image/s3,"s3://crabby-images/d2404/d2404747ceb832b2fcaab766dc2711a609c69f5e" alt=""
5、一次性创建所有HDFS子目录
逐级创建很麻烦,但是可以添加参数-p,来一次性创建多级目录:
data:image/s3,"s3://crabby-images/ded7f/ded7f2c8c0cc91b9ced955886ba037e91a3914b2" alt=""
二.从本地计算机复制文件到HDFS
1、复制本地文件到HDFS:
准备工作,创建本地文件
data:image/s3,"s3://crabby-images/57e66/57e660f52b693af02a67cc104542ff3975dcbb41" alt=""
data:image/s3,"s3://crabby-images/19a6d/19a6d45e8ae464caa47e47ad7b497bf63d3c0434" alt=""
随便写的内容进去lc.txt
按Esc 再:wq保存退出
data:image/s3,"s3://crabby-images/7503a/7503a18d421c534c87f95006bd73804e28024b6e" alt=""
2、列出文件内容:
data:image/s3,"s3://crabby-images/8e42f/8e42ff0b03890d731f5a5803936c3d139ad501bd" alt=""
可以使用:hadoop fs -cat /user/hduser/test/test1.txt | more 进行分页显示
3、如果复制到HDFS的文件已经存在,会报错,此时可以使用-f 参数,强制复制重复文件到HDFS目录:
data:image/s3,"s3://crabby-images/0932b/0932b13fc183be070c62c440461db3c743731362" alt=""
4、从本地复制多个文件到HDFS,中间用空格分割即可。
5、从本地复制整个目录到HDFS:
data:image/s3,"s3://crabby-images/2a518/2a5183e3ccd02d58f4ac9231caab9d7da72741bc" alt=""
6、列出HDFS目录下的所有文件(包括这个目录下子目录的文件)
data:image/s3,"s3://crabby-images/67d0c/67d0c5b597a2f4765bdfb27554e37740b1cffd59" alt=""
7、使用put复制文件到HDFS,这个参数与copyFromLocal的不同之处在于:
-put更宽松,可以把本地或者HDFS上的文件拷贝到HDFS中;而-copyFromLocal则更严格限制只能拷贝本地文件到HDFS中。如果本地和HDFS上都存在相同路径,则-put跟趋于优先取HDFS的源。(不用太深究两者区别,更多用-put)
data:image/s3,"s3://crabby-images/a36d4/a36d4e72d21e58bc092e6ffeaf0e3edc751e605e" alt=""
三.从HDFS上复制文件到本地
1、参数 -copyToLocal
data:image/s3,"s3://crabby-images/b3ce6/b3ce60e7ba846ac6ebaa3dafc0e4da378a402c1c" alt=""
2、同样的也可以用参数-get完成上述操作:
data:image/s3,"s3://crabby-images/6c76c/6c76c8b4df27d4bd2462db20bdd69f50f2ecb9a1" alt=""
四.复制与删除HDFS文件
1、使用-cp参数,在HDFS上进行复制文件
data:image/s3,"s3://crabby-images/7a4da/7a4da7d9067c14238cf2c3389c36c7d2e25ebf3a" alt=""
2、使用-rm参数,删除HDFS上的文件;添加-R参数,删除目录:
data:image/s3,"s3://crabby-images/168a7/168a7803c6f5f2b265e1d237e926964417d6875d" alt=""
data:image/s3,"s3://crabby-images/4d27c/4d27c3081814cb697166a38beb0c8cb3bcf8b9be" alt=""
完成实验后一定要关闭 hadoop ,避免下次启动虚拟机时 hadoop 出现问题。
data:image/s3,"s3://crabby-images/51cbf/51cbf07b49a474083683912896c7898e93722542" alt=""
------------学习笔记