hadoop的运行模式

Hadoop的运行模式

hadoop一共有如下三种运行方式:

  1. 本地运行。数据存储在linux本地,测试偶尔用一下。我们上一节课使用的就是本地运行模式hadoop100。

  2. 伪分布式。在一台机器上模拟出 Hadoop 分布式系统的各个组件,各个组件在逻辑上是分离的,但是都运行在同一台物理机器上,以此来模拟分布式环境。

  3. 完全分布式。数据存储在HDFS,多台服务器工作,企业中大量使用。

要在本地去模拟这个真实的场景功能,我们需要做好如下的准备:

1)准备3台客户机(关闭防火墙、静态IP、主机名称)

2)安装javaJDK,安装Hadoop,并配置环境变量

3)配置集群

4)单点启动

5)配置ssh

6)群起并测试集群

其中,第1项我们在之前克隆虚拟机的环节中已经完成了。现在我们来看看按照JDK和Hadoop并配置环境变量的工作。有两种思路:

  1. 每台机器都去手动安装一次(上传jar包再去解压)。

  2. 把一台机器装好,把module 拷贝到其他的机器。这样就不需要省略了上传和解压的工作了。

scp 命令 -- 基本使用

我们在前面的课中把hadoop100上安装了java,hadoop这个两个软件,那我们要如何才能把对于的文件拷贝到hadoop101上去?

现在要学一个新的命令: scp。它可以实现服务器与服务器之间的数据拷贝。

1. 基本语法

scp -r pdir/fname user@host:pdir/fname

说明:

(1)-r: 表示递归拷贝。如果要拷贝的是文件夹,就把文件夹下的内容都拷贝

(2)pdir/fname: 要拷贝的文件路径/名称

(3)user@host:pdir/$fname: 目的地用户@主机:目的地路径/名称

注意:要输入相应的账号和密码!

相关推荐
m0_3801671418 小时前
如何用订单簿数据判断真假突破(OrderBook 实战)
大数据·人工智能·区块链
byoass19 小时前
企业云盘全文检索技术选型:Elasticsearch、MeiliSearch、Typesense实战对比
大数据·网络·安全·elasticsearch·云计算·全文检索
紧固视界19 小时前
分布式光伏系统中紧固件选型与应用解析_2026上海紧固件专业展
分布式·上海紧固件展·紧固件展·上海紧固件专业展
财迅通Ai19 小时前
晨光新材:产能释放驱动增长 全产业链优势稳固向好
大数据·人工智能·晨光新材
无籽西瓜a19 小时前
【西瓜带你学Kafka | 第七期】Kafka 日志存储体系:保留清理、消息格式与分段刷新策略(文含图解)
java·分布式·后端·kafka·消息队列·mq
BizViewStudio19 小时前
小程序泛在化时代:2026 年跨平台开发技术选型指南
大数据·网络·人工智能·小程序·媒体
@insist1231 天前
信息安全工程师考点精讲:身份认证核心原理与分类体系(上篇)
大数据·网络·分类·信息安全工程师·软件水平考试
天辛大师1 天前
AI助力旅游扩大化,五一旅游公园通游年票普惠研究
大数据·启发式算法·旅游
WordPress学习笔记1 天前
镌刻中式美学的高端WordPress主题
大数据·人工智能·wordpress
数智化精益手记局1 天前
拆解物料管理erp系统的核心功能,看物料管理erp系统如何解决库存积压与缺料难题
大数据·网络·人工智能·安全·信息可视化·精益工程