大数据技术原理-HDFS的安装与应用

摘要

本实验报告详细记录了"大数据技术原理"课程中的HDFS(Hadoop分布式文件系统)实验。实验环境基于Ubuntu操作系统,Hadoop框架,以及开发工具JDK和Eclipse。实验内容涵盖了Hadoop的启动、HDFS命令的操作,包括目录的创建、文件的查看、复制、移动和删除,以及通过Java应用程序与HDFS的交互。实验中,解决了运行HDFS时的启动顺序问题,以及如何验证Java应用程序与HDFS交互后文件的生成情况。通过本次实验,深入了解了HDFS的基本命令及其作用,掌握了在Hadoop平台上进行文件操作的方法,并提高了使用Java进行大数据处理的能力。

关键词:HDFS;Hadoop;大数据;文件系统;Java应用程序

一.实验环境:

  1. Ubuntu
  2. Hadoop
  3. JDK和eclipse

二.实验内容与完成情况:

1.启动hadoop:

2.查看hdfs支持的操作:

3.查看具体命令的作用:

4.新建文件夹:

5.运行命令显示HDFS与当前用户对应目录下的内容:

6.创建input目录:

7.删除input文件:

8.复制文件到生成的input文件中:

9.查看HDFS中txt文件的内容:

10.将txt文件移动到其他文件夹下:

11.查看:

12.在eclipse中创建项目,配置所需要的jar包,编写一个可以和HDFS相交互的Java应用程序:

13.编写代码:

14.生成jar包,部署相关的应用程序,生成一个文件夹存放信息:

15.打包好的文件:

16.执行命令查看文件信息:

三.出现的问题及解决方法:

  1. 运行hdfs的时候,需要注意先启动hadoop系统,如果不清楚对应的hdfs的操作,可以使用./bin/hdfs dfs,命令查看。
  2. 在运行完成主程序之后,需要在hdfs上查看是否成功运行生成对应文件。

四.总结:

Hadoop中HDFS的命令及作用:

1.创建目录hdfs dfs -mkdir /

2.查看目录下载文件hdfs dfa -ls / hdfs dfs -ls /

3.上传本地文件:hdfs dfs -put a.txt /

4..删除文件/目录:hdfs dfs -rm /test/a.txt 删除目录hdfs dfs -rm -r /test

5.复制文件:hdfs dfs -cp /test/a.txt /

相关推荐
188105069634 小时前
摸鱼事务所——团队作业——大模型评测作业
大数据·hadoop·分布式
程序员_大白4 小时前
软件工程课程管理系统项目设计,零基础入门到精通,收藏这篇就够了
大数据·软件工程
我思故我在78964 小时前
hdfs文件系统
大数据·hadoop·hdfs
大连赵哥4 小时前
分布式文件存储系统:Hadoop HDFS
hadoop·分布式·hdfs
老卢聊运维4 小时前
kdc-server部署kerberos认证
大数据·运维·hdfs
王小王-1234 小时前
基于Hadoop的服装电商数据分析系统【Hdfs、flume、HIve、sqoop、MySQL、echarts】
hive·hadoop·hdfs·服装电商分析·服装大数据
Plastic garden5 小时前
Redis(2) redis的高可用
java·数据库·redis
XiYang-DING5 小时前
【Spring】SpringIoC&DI
java·spring·log4j
刀法如飞5 小时前
Palantir Ontology 存储结构与读写机制原理深入剖析
大数据·设计模式·系统架构