hadoop学习之hdfs学习

HDFS 文件系统,可以说是分布式数据库吧

结构是 目录树

适用场景:一次写入,多次读出.好像不太支持改删

优点:

1.高容错:

因为他会备份,所以一份出问题了,并不影响其他几份

如果副本丢失后,定时恢复.应该是定时检查然后恢复

每次启动,DN向NN汇报备份的存储情况.默认每个6个小时重新汇报

2.要求比较低

不需要对服务器有特定要求(如高级服务器有负载均衡功能1台20W多)

缺点:

1.不适合低延时数据访问,

2.无法高效对大量小文件进行存储.

NameNode的内存是固定的,也就是说,目录和块信息总有完的时候,如果全是小程序,就亏的很.

小文件存储的寻址超过读取,违反HDFS设计目标

总结: 不值得 占内存太大 找数据太麻烦 效率太低 消耗太高,性价比不足

3.不支持并发写入,文件随机修改

一个文件不能多个线程同时写入.

只支持数据append,不支持随机修改

其实还是快,如果要修改的话,有可能影响多个块,因为写多了,后面的块可能都会被改掉.有可能直接影响结构了.

设置块大小:

传输时间 = 寻址时间 / 0.01

所以看磁盘传输的秒速

要在shell使用hadoop命令,必须先输入 hadoop fs

合并下载getmerage就是,下载多个文件,内容合并到一个文件中

cp 和mv处理目录这里都不需要-r

rm 删除目录 -r

-f是免回答

du 统计文件夹大小

第一列 是单个大小

第二列 备份大小

setrep 设置副本数量

这个只能针对某个文件修改

设置之后,立刻生效

配置Window环境

  1. dll放入system32
  2. 配置环境变量(Hadoop)

流程: 连 用 关

1.创建客户端连接对象




相关推荐
屁股割了还要学5 小时前
【数据结构入门】栈和队列
c语言·开发语言·数据结构·学习·算法·青少年编程
少说多做34310 小时前
Git 基础操作笔记(速查)
笔记·git·学习
m0_6265352011 小时前
贪心算法学习 3 买卖股票的最佳时机 i ii
学习·算法·贪心算法
开始学AI11 小时前
【Datawhale AI夏令营】多模态RAG财报问答挑战赛:学习笔记与上分思考
笔记·学习
数据知道12 小时前
将英文PDF文件完整地翻译成中文的4类方式
人工智能·学习·自然语言处理·pdf·机器翻译
Aousdu13 小时前
算法_python_学习记录_01
python·学习·算法
雪球不会消失了13 小时前
Kafka学习记录
分布式·学习·kafka
计算机源码社14 小时前
分享一个基于Spark的眼科疾病临床数据可视化分析与应用研究Hadoop基于Vue和Echarts的眼科疾病统计数据交互式可视化系统的设计与实现
hadoop·信息可视化·spark·毕业设计选题·毕业设计项目·毕业设计源码·大数据源码
胡萝卜的兔14 小时前
go语言标准库学习, fmt标准输出,Time 时间,Flag,Log日志,Strconv
开发语言·学习·golang
●VON16 小时前
重生之我在暑假学习微服务第十一天《配置篇》+网关篇错误订正
java·学习·微服务·云原生·暑假