大数据技术原理-HDFS的安装与应用

摘要

本实验报告详细记录了"大数据技术原理"课程中的HDFS(Hadoop分布式文件系统)实验。实验环境基于Ubuntu操作系统,Hadoop框架,以及开发工具JDK和Eclipse。实验内容涵盖了Hadoop的启动、HDFS命令的操作,包括目录的创建、文件的查看、复制、移动和删除,以及通过Java应用程序与HDFS的交互。实验中,解决了运行HDFS时的启动顺序问题,以及如何验证Java应用程序与HDFS交互后文件的生成情况。通过本次实验,深入了解了HDFS的基本命令及其作用,掌握了在Hadoop平台上进行文件操作的方法,并提高了使用Java进行大数据处理的能力。

关键词:HDFS;Hadoop;大数据;文件系统;Java应用程序

一.实验环境:

  1. Ubuntu
  2. Hadoop
  3. JDK和eclipse

二.实验内容与完成情况:

1.启动hadoop:

2.查看hdfs支持的操作:

3.查看具体命令的作用:

4.新建文件夹:

5.运行命令显示HDFS与当前用户对应目录下的内容:

6.创建input目录:

7.删除input文件:

8.复制文件到生成的input文件中:

9.查看HDFS中txt文件的内容:

10.将txt文件移动到其他文件夹下:

11.查看:

12.在eclipse中创建项目,配置所需要的jar包,编写一个可以和HDFS相交互的Java应用程序:

13.编写代码:

14.生成jar包,部署相关的应用程序,生成一个文件夹存放信息:

15.打包好的文件:

16.执行命令查看文件信息:

三.出现的问题及解决方法:

  1. 运行hdfs的时候,需要注意先启动hadoop系统,如果不清楚对应的hdfs的操作,可以使用./bin/hdfs dfs,命令查看。
  2. 在运行完成主程序之后,需要在hdfs上查看是否成功运行生成对应文件。

四.总结:

Hadoop中HDFS的命令及作用:

1.创建目录hdfs dfs -mkdir /

2.查看目录下载文件hdfs dfa -ls / hdfs dfs -ls /

3.上传本地文件:hdfs dfs -put a.txt /

4..删除文件/目录:hdfs dfs -rm /test/a.txt 删除目录hdfs dfs -rm -r /test

5.复制文件:hdfs dfs -cp /test/a.txt /

相关推荐
无限的鲜花8 小时前
反射(原创推荐)
java·开发语言
运维行者_8 小时前
企业无线网络监控的挑战与智能化演进趋势
大数据·运维·服务器·网络·数据库
IT二叔8 小时前
Java项目部署-03-teamcity-cicd-docker镜像流水线方式部署
java·ci/cd·持续部署
一路向北he8 小时前
字节钢铁军团--“提供情境,而非控制”
java·开发语言·前端
QiLinkOS8 小时前
第三视觉理解徐玉生与他的商业活动(30)
大数据·c++·人工智能·算法·开源协议
超级数据查看器9 小时前
超级数据查看器 v10.0 发布
java·大数据·数据库·sqlite·安卓
数安3000天9 小时前
增量数据如何自动分类分级,避免目录“过期“?
大数据·数据库
折哥的程序人生 · 物流技术专研10 小时前
《Java 100 天进阶之路》第50篇:阻塞队列与并发容器(2026版)
java·面试题·java进阶·blockingqueue·并发容器·集合源码·java100天进阶
ai_coder_ai10 小时前
编写自动化脚本,在自己后端服务中使用Open Api进行设备相关操作
java·运维·自动化
killerbasd11 小时前
总结 7.04
jvm