【并行分布计算】Hadoop伪分布搭建

Hadoop伪分布搭建

  1. 修改core-site.xml

fs.defaultFS设置的是HDFS的地址,设置运行在本地的9000端口上

hadoop.tmp.dir设置的是临时目录,如果没有设置的话默认在/tmp/hadoop-${user.name}中,系统重启后会导致数据丢失,因此修改这个临时目录的路径

创建临时目录:

root@hadoop00 hadoop# mkdir -p /export/servers/hadoop-2.7.6/tmp

2.修改hdfs-site.xml

dfs.replication设置的是HDFS存储的临时备份数量,因为伪分布模式中只有一个节点,所以设置为1。

3.修改hadoop-env.sh

  1. 本地无密码ssh连接

(1)查看是否开启sshd服务

root@hadoop00 hadoop# systemctl status sshd

(2)localhost连接

(3)配置密钥认证连接

5.配置文件

(1)配置core-site.xml

root@hadoop00 hadoop# vi core-site.xml

(2)配置hdfs-site.xml

root@hadoop00 hadoop# vi hdfs-site.xml

对hdfs-site.xml进行同样的替换操作,属性的含义分别为复制的块的数量、DFS管理节点的本地存储路径、DFS数据节点的本地存储路径

(3)配置mapred-site.xml

root@hadoop00 hadoop# vi mapred-site.xml

yarn 是一种资源管理和作业调度技术,作为Hadoop 的核心组件之一,负责将系统资源分配给在 Hadoop 集群中运行的各种应用程序,并调度要在不同集群节点上执行的任务,其基本思想是将资源管理和作业调度/监视的功能分解为单独的 daemon,总体上yarn是 master/slave 结构,在整个资源管理框架中,ResourceManager 为 master,NodeManager 是 slaver。

(4)配置yarn-site.xml

root@hadoop00 hadoop# vi yarn-site.xml

配置yarn-site.xml文件,这里修改NodeManager上运行的附属服务即可:

  1. 格式化后启动、调用实例、停止所有运行的hadoop进程

(1)格式化并启动

root@hadoop00 hadoop-2.7.6# bin/hdfs namenode -format

(2)启动全部进程

root@hadoop00 hadoop-2.7.6# start-all.sh

7.测试

(1)生成输入目录

bin/hdfs dfs -mkdir /user

bin/hdfs dfs -mkdir /user/root

bin/hdfs dfs -mkdir input

bin/hdfs dfs -put etc/hadoop/*.xml input(2)测试

(2)测试

hdfs dfs -put /export/servers/hadoop-2.7.6/etc/hadoop/*.xml input

(3)获取输出

相关推荐
kebidaixu7 小时前
BCU 平台 RS485 驱动适配:从 THVD1406 到 ISO3082
linux
谢平康10 小时前
解决用 rm 报bash: /usr/bin/rm: Argument list too long错
linux·运维·运维开发
hj28625111 小时前
Linux 网络服务综合笔记(概念 + 命令 + 实操案例)2
linux·运维·网络
what_201811 小时前
Linux 磁盘 (查看、划分、inode)
linux·运维·服务器
27399202911 小时前
GDB调试(Linux)
linux
凡人叶枫12 小时前
Effective C++ 条款23:宁以 non-member、non-friend 替换 member 函数
linux·开发语言·c++·嵌入式开发
不会C语言的男孩12 小时前
Linux 系统编程 · 第 4 章:文件属性与元数据
linux·c语言·开发语言
小生不才yz12 小时前
Shell脚本精读 · S02-03 | 词拆分、通配符与未加引号的变量
linux
2601_9618454212 小时前
法考真题及答案解析|历年真题|资料已整理
linux·windows·ubuntu·macos·centos·gnu
A_humble_scholar12 小时前
Linux(七)调度器:从硬件矛盾到进程切换的底层逻辑
linux·服务器·网络