Hadoop的概述

新手小农2023-11-16 23:42

1、Hadoop的发展史：

Google首先发布三篇文章：GFS(Google File System)、Mapreduce（计算引擎）、Bigtable

，随着时间的推移：

hadoop1.0与2.0 的区别是在2.0的版本中出现了yarn，主要是负责资源的调度,hadoop2.0与3.0的主要的区别就是：3.0版本开始支持GPU

2、什么是Hadoop？

Hadoop是一个基于海量数据的分布式存储和分布式计算的平台。

3、Hadoop的三大组件：

1、Hdfs：

是一种分布式文件系统，主要的作用是存储数据。

2、Yarn：

作业调度和集群资源管理的框架，主要的作用是负责资源的分配。

3、MapReduce：

基于YARN的系统，用于并行处理大型数据集，是大数据中的计算框架。

4、名词科普：

服务器(节点):

企业里任务和程序基本都是运行在服务器上。服务器内存和cpu以及硬盘等资源和性能远高于pc机，可以将其理解为一台台的计算机。

机架：

一个公司里，会有很多服务器。尤其是hadoop集群大到上千台服务器搭建成集群负责存放服务器的架子。

上一篇：考虑区域多能源系统集群协同优化的联合需求侧响应模型(matlab代码)

下一篇：代码随想录算法训练营Day 53 || 1143.最长公共子序列、1035.不相交的线、53. 最大子序和

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 052026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 08AI科技热点日报 | 2026年07月01日 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026上半年大模型全景技术解读：推理融合、Agent 爆发与多模态统一