Apache Hadoop-学习笔记1

学习视频:https://www.bilibili.com/video/BV1CU4y1N7Sh?spm_id_from=333.788.player.switch&vd_source=f8edb730040256369513da6f2506c493&p=23

02-Apache Hadoop介绍、发展简史、现状

1、Hadoop介绍

  • 侠义上 Hadoop 指的是 Apache 软件基金会的一款开源软件

用 java语言实现,开源,允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理

  • Hadoop 核心组件

Hadoop HDFS( 分布式文件存储系统 ):解决海量数据存储

Hadoop YARN(集群资源管理和任务调度框架):解决资源任务调度

Hadoop MapReduce (分布式计算框架):解决海量数据计算

  • 官网

http://hadoop.apache.org/

  • 广义上 Hadoop 指的是围绕 Hadoop 打造的大数据生态圈

2、Hadoop发展简史

  • **Hadoop之父:**Doug Cutting
  • Hadoop起源于Apache Lucene子项目:Nutch

Nutch 的设计目标是构建一个大型的全网搜索引擎。

遇到瓶颈:如何解决数十亿网页的存储和索引问题

3、Hadoop现状

03-Apache Hadoop特性优点、国内外应用

1、Hadoop特性优点

2、Hadoop国内应用

3、国外应用

04-Apache Hadoop发行版本、架构变迁

1、Apache Hadoop发行版本

2、Hadoop架构变迁(1.0-2.0变迁)

3、Hadoop架构变迁(3.0新版本)

05-Apache Hadoop安装部署-集群组成介绍

1、Hadoop集群整体概述

HDFS数据存储、YARN资源管理调度、MapReduce进行程序计算

2、Hadoop集群简介

06-Apache Hadoop安装部署-服务器基础环境设置

1、Hadoop源码编译

  • 如果编译

编译需要的工具如下:

步骤一:集群角色规划

步骤二:服务器基础环境准备

  • 主机名(3台机器)

vim /etc/hostname

  • Hosts映射(3台机器)

vim /etc/hosts

相关推荐
破浪前行·吴30 分钟前
数据结构概述
数据结构·学习
.千余2 小时前
【Linux】基本指令3
linux·服务器·开发语言·学习
南境十里·墨染春水2 小时前
C++ 笔记 thread
java·开发语言·c++·笔记·学习
南境十里·墨染春水2 小时前
C++ 笔记 高级线程同步原语与线程池实现
java·开发语言·c++·笔记·学习
lkforce2 小时前
MiniMind学习笔记(二)--model_minimind.py
笔记·python·学习·minimind·minimindconfig
三品吉他手会点灯4 小时前
C语言学习笔记 - 1.C概述 - 本讲内容概述
c语言·笔记·学习
嵌入式小企鹅4 小时前
国产大模型与芯片加速融合,RISC-V生态多点开花,AI编程工具迈入自动化新纪元
人工智能·学习·ai·嵌入式·算力·risc-v·半导体
光影少年4 小时前
Monorepo架构是什么,如何学习Monorepo架构?
前端·学习·架构·前端框架
醇氧4 小时前
Hermes Agent 学习(安装部署详细教程)
人工智能·python·学习·阿里云·ai·云计算
光影少年6 小时前
Python+LangGraph学习路线及发展前景
开发语言·人工智能·python·学习