hadoop hdfs优势和缺点

一橘Java小菜鸟2024-05-23 9:56

hdfs优点

高容错性
适合处理大数据
可构建再廉价的机器上

hdfs缺点

不适合做低延迟数据访问

毫秒级的存储数据做不到

无法高效的对大量小文件进行存储
不支持并发写入文件随机修改

一个文件只能有一个writer 不允许多个线程同时写
仅支持数据追加不支持文件的随机修改

hdfs组织结构

namenode 就是master 他是一个主管管理者

管理hdfs的名称空间
配置副本策略
管理数据块映射信息
处理客户端读写请求

datanode 就是slave namenode下达命令 datanode执行实际的存储

存储实际的数据块
执行数据块的读写操作

client 就是客户端

文件切分文件上传hdfs的时候 client讲文件切分成一个一个的block 然后进行上传
与namenode交互获取文件的位置信息
与datanode交互读取或者写入数据
client 提供一些命令来管理hdfs
cleint 可以通过一些命令来访问hdfs

secondary namenode 并非namenode 热备当name挂掉的时候他并不能马上替换namenode 并提供服务

辅助namenode 分担工作量
紧急情况可辅助恢复namenode

hdfs 文件块大小

hdfs的文件在物理上是分块存储块的大小可以通过配置参数来规定 dfs.blocksize 默认大小在hadoop 128m
如果寻址时间约为10ms，即查找到目标block的时间为 10ms。
寻址时间为传输时间的1% 时，则为最佳状态。（专家）因此，传输时间 =10ms/0.01=1000ms=1s
而目前磁盘的传输速率普遍为100MB/s。

上一篇：设计模式--命令模式

下一篇：中兴通讯携手AIS，助力泰国5G通信事业发展

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09CC-Switch & Claude 基于 Linux 服务器安装使用指南 10Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费