hadoop hdfs优势和缺点

hdfs优点

  1. 高容错性
  2. 适合处理大数据
  3. 可构建再廉价的机器上

hdfs缺点

  1. 不适合做低延迟数据访问
  • 毫秒级的存储数据做不到
  1. 无法高效的对大量小文件进行存储
  2. 不支持并发写入 文件随机修改
  • 一个文件只能有一个writer 不允许多个线程同时写
  • 仅支持数据追加 不支持文件的随机修改

hdfs组织结构

namenode 就是master 他是一个主管 管理者
  1. 管理hdfs的名称空间
  2. 配置副本策略
  3. 管理数据块映射信息
  4. 处理客户端读写请求
datanode 就是slave namenode下达命令 datanode执行实际的存储
  1. 存储实际的数据块
  2. 执行数据块的读写操作
client 就是客户端
  1. 文件切分 文件上传hdfs的时候 client讲文件切分成一个一个的block 然后进行上传
  2. 与namenode交互 获取文件的位置信息
  3. 与datanode交互 读取或者写入数据
  4. client 提供一些命令来管理hdfs
  5. cleint 可以通过一些命令来访问hdfs
secondary namenode 并非namenode 热备 当name挂掉的时候 他并不能马上替换namenode 并提供服务
  1. 辅助namenode 分担工作量
  2. 紧急情况 可辅助恢复namenode
hdfs 文件块大小
  1. hdfs的文件在物理上是分块存储 块的大小可以通过配置参数来规定 dfs.blocksize 默认大小在hadoop 128m
  2. 如果寻址时间约为10ms, 即查找到目标block的时间为 10ms。
  3. 寻址时间为传输时间的1% 时,则为最佳状态。(专家) 因此,传输时间 =10ms/0.01=1000ms=1s
  4. 而目前磁盘的传输速率普 遍为100MB/s。
相关推荐
九河云30 分钟前
TOS + 数字孪生:集装箱码头的智能进化密码
大数据·服务器·网络·数据库·数字化转型
说私域36 分钟前
开源链动2+1模式AI智能名片S2B2C商城小程序在竞争激烈的中低端面膜服装行业中的应用与策略
大数据·人工智能·小程序
bemyrunningdog1 小时前
IntelliJ IDEA合并分支到master全攻略
大数据·elasticsearch·intellij-idea
孟意昶1 小时前
Doris专题17- 数据导入-文件格式
大数据·数据库·分布式·sql·doris
夫唯不争,故无尤也1 小时前
Maven创建Java项目实战全流程
java·数据仓库·hive·hadoop·maven
星光一影2 小时前
Java版小区物业管理系统/业主端/物业端/管理端/支持公众号、小程序、app
java·大数据·小程序
武子康2 小时前
大数据-125 - Flink 实时流计算中的动态逻辑更新:广播状态(Broadcast State)全解析
大数据·后端·flink
数在表哥2 小时前
从数据沼泽到智能决策:数据驱动与AI融合的中台建设方法论与技术实践指南(一)
大数据·人工智能
还是大剑师兰特3 小时前
Hadoop面试题及详细答案 110题 (71-85)-- 集群部署与运维
大数据·hadoop·大剑师·hadoop面试题
gddkxc3 小时前
悟空 AI CRM 的回款功能:加速资金回流,保障企业财务健康
大数据·人工智能·信息可视化