大数据学习1：Hadoop单机版环境搭建

rui锐rui2025-07-10 9:57

1.基础知识介绍

Flume采集日志。Sqoop采集结构化数据，比如采集数据库。

存储到HDFS上。

YARN资源调度，每台服务器上分配多少资源。

Hive是基于Hadoop的一个数据仓库工具，提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。MapReduce将HDFS数据分割，整合键值对，再整到HDFS。

Spark是一款大数据处理框架，其开发初衷是改良Hadoop MapReduce的编程模型和提高运行速度。Spark主要面向批处理需求，但也支持流处理，因其优异的性能和易用的接口，Spark已经是批处理界绝对的王者。

Kafka也是一种面向大数据领域的消息队列框架，一个企业经常拆分出很多不同的应用系统，系统之间需要建立数据流管道。

2.具体流程

使用虚拟机新建了centos7的linux系统，在上面部署的

一、环境准备

1.上传下载的jdk包

2.解压JDK安装包

3.配置环境变量

4.配置免密登录，ip改成自己的ip

二、配置Hadoop

1.上传下载的Hadoop包

2.进入/opt/server/hadoop-3.1.0/etc/hadoop 目录下，修改以下配置，都是vim打开修改

3.初始化并启动HDFS

我的是http://192.168.59.100:9870/

三、Hadoop(YARN)环境搭建

1.修改配置文件，进入/opt/server/hadoop-3.1.0/etc/hadoop 目录下，修改以下配置

2.启动服务

在这个文件夹下面cd /opt/server/hadoop-3.1.0/sbin/

在当前目录下启动

访问地址为：http://192.168.59.100:8088/

上一篇：Vue路由钩子全攻略：让你的页面跳转更丝滑！

下一篇：从卡顿到丝滑：uni-app房产App性能优化实践

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 05OpenClaw优化飞书API 额度已耗尽问题 06小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）07Window 10部署openclaw报错node.exe : npm error code 128 08Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 09OpenClaw大龙虾机器人完整安装教程 10网站改了域名，如何查找？