详细教程-Linux上安装单机版的Hadoop

1、上传Hadoop安装包至linux并解压

bash 复制代码
tar -zxvf hadoop-2.6.0-cdh5.15.2.tar.gz

安装包:

链接:https://pan.baidu.com/s/1u59OLTJctKmm9YVWr_F-Cg

提取码:0pfj

2、配置免密码登录

生成秘钥:

bash 复制代码
ssh-keygen -t rsa -P ''


将秘钥写入认证文件:

bash 复制代码
cd ~/.ssh
cat id_rsa.pub >> ~/.ssh/authorized_keys

修改认证文件权限:

bash 复制代码
chmod 600 ~/.ssh/authorized_keys

3、配置环境变量

将 Hadoop 加入环境变量 /etc/profile :

bash 复制代码
vi /etc/profile

4、修改Hadoop配置文件

1 ) 修改hadoop-env.sh 文件

bash 复制代码
vi /usr/local/hadoop-2.6.0-cdh5.15.2/etc/hadoop/hadoop-env.sh

修改 JAVA_HOME :(这里要改成你自己linux中的jdk路径)

bash 复制代码
export JAVA_HOME=/usr/local/jdk1.8.0_181

2 )修改 core-site.xml 文件

XML 复制代码
<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://lcc:9090</value>
        </property>
</configuration>
  1. 修改 hdfs-site.xml 文件
XML 复制代码
<configuration>
        <property>
                <name>dfs.replication</name>
                <value>1</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/usr/local/hadoop-2.6.0-cdh5.15.2/tmp</value>
        </property>
</configuration>
  1. 修改mapred-site.xml文件
bash 复制代码
cp mapred-site.xml.template mapred-site.xml
vi mapred-site.xml
XML 复制代码
<configuration>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
</configuration>

5 )修改 slaves 文件

bash 复制代码
vi slaves

改成上面的 lcc(这里就是你的一个主机名,注意要在hosts文件中配置好 ip地址 主机名)
这里配置的是单节点, 指向本机主机名称。
6)修改yarn-site.xml

XML 复制代码
<configuration>
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
</configuration>

5、启动Hadoop服务

进入到sbin目录

bash 复制代码
cd /usr/local/hadoop-2.6.0-cdh5.15.2/sbin/

执行启动脚本

bash 复制代码
./start-all.sh

上传一个文件, 用于测试:

XML 复制代码
hdfs dfs -put /usr/local/hadoop-2.6.0-cdh5.15.2/etc/hadoop/hadoop-env.sh /

如果遇到如下报错:

请执行以下命令解决

再次重新执行hdfs上传即可

6、访问验证

至此Hadoop单机版安装完毕

相关推荐
70asunflower18 分钟前
Emulation,Simulation,Virtualization,Imitation 的区别?
linux·docker
聆风吟º43 分钟前
CANN开源项目实战指南:使用oam-tools构建自动化故障诊断与运维可观测性体系
运维·开源·自动化·cann
NPE~1 小时前
自动化工具Drissonpage 保姆级教程(含xpath语法)
运维·后端·爬虫·自动化·网络爬虫·xpath·浏览器自动化
神梦流1 小时前
GE 引擎的内存优化终局:静态生命周期分析指导下的内存分配与复用策略
linux·运维·服务器
凡人叶枫1 小时前
C++中输入、输出和文件操作详解(Linux实战版)| 从基础到项目落地,避坑指南
linux·服务器·c语言·开发语言·c++
wdfk_prog1 小时前
[Linux]学习笔记系列 -- [drivers][input]serio
linux·笔记·学习
十月南城1 小时前
Hive与离线数仓方法论——分层建模、分区与桶的取舍与查询代价
数据仓库·hive·hadoop
xuhe21 小时前
[全流程详细教程]Docker部署ClawBot, 使用GLM4.7, 接入TG Bot实现私人助理. 解决Docker Openclaw Permission Denied问题
linux·docker·ai·github·tldr
Lsir10110_2 小时前
【Linux】进程信号(下半)
linux·运维·服务器
skywalk81632 小时前
unbound dns解析出现问题,寻求解决之道
运维·服务器·dns·unbound