1 Hadoop入门

1.Hadoop是什么?

(1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

(2)主要解决,海量数据的存储和海量数据的分析计算问题。

(3)广义上来说,Hadoop通常是指一个更广泛的概念------Hadoop生态圈

2.Hadoop的优势


3 Hadoop组成

4 HDFS概述

5 YARN架构概述

Yet Another Resource Negotiator 简称 YARN ,另一种资源协调者,是 Hadoop 的资源管理器。

yarn主要管理的是整个集群的内存和cpu

ApplicationManager运行在Container(容器)上,容器是一种虚拟化的技术,类似阿里云的容器虚拟技术,不会是真正的无数台服务器.

6 MapReduce架构概述

负责hadoop中的计算部分

7 HDFS、YARN、MapReduce 三者关系

相关推荐
Elastic 中国社区官方博客2 小时前
在 Elasticsearch 中使用 Mistral Chat completions 进行上下文工程
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
橙色云-智橙协同研发2 小时前
从 CAD 图纸到 Excel 数据:橙色云智橙 PLM 打造制造企业数字化协同新模式
大数据·功能测试·云原生·cad·plm·云plm·bom提取
喝可乐的希饭a3 小时前
Elasticsearch 的 Routing 策略详解
大数据·elasticsearch·搜索引擎
TDengine (老段)5 小时前
TDengine 字符串函数 CHAR 用户手册
java·大数据·数据库·物联网·时序数据库·tdengine·涛思数据
2501_933670795 小时前
高职大数据技术专业需要的基础
大数据
科技峰行者7 小时前
微软与OpenAI联合研发“Orion“超大规模AI模型:100万亿参数开启“科学家AI“新纪元
大数据·人工智能·microsoft
拓端研究室7 小时前
2025母婴用品双11营销解码与AI应用洞察报告|附40+份报告PDF、数据、绘图模板汇总下载
大数据·人工智能
GOATLong7 小时前
git使用
大数据·c语言·c++·git·elasticsearch
blammmp7 小时前
RabbitMQ:仲裁队列 && HAProxy
分布式·rabbitmq
9ilk7 小时前
【仿RabbitMQ的发布订阅式消息队列】--- 前置技术
分布式·后端·中间件·rabbitmq