【Hadoop】HDFS 分布式存储系统

小白不想白a2025-08-26 19:06

Namenode是整个HDFS文件系统的前端，只有一个，管理数据块映射信息，配置副本策略，处理客户端的读写请求。

Secondary namenode是namenode的热备，当active namenode出现故障时，快速切换为新的active namenode。定期更新系统镜像和操作日志。

Datanode有多个，存储数据块，执行数据块读写。

HDFS client与文件系统进行交互。

文件被切分成数据块，分布存储，默认情况下每个块有三个副本。

HDFS不适合保存小文件。一个k和一个t数据块的元数据大小是相同的，元数据会存储在namenode，但namenode内存是有限的。大小文件的访问速度相同，存取大量小文件浪费很多寻道时间。

上一篇：大数据毕业设计选题推荐-基于大数据的丙型肝炎患者数据可视化分析系统-Hadoop-Spark-数据可视化-BigData

下一篇：小型Apache上如何屏蔽好奇窥探者的实用方法

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 06幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 07微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 092026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……