【hadoop】部署hadoop的伪分布模式

hadoop的伪分布模式

伪分布模式的特点

  1. 在单机上,模拟一个分布式的环境
  2. 具备Hadoop的所有的功能
  3. 用于开发和测试
复制代码
    HDFS:NameNode、DataNode、SecondaryNameNode
复制代码
   Yarn:ResourceManager、NodeManager

部署伪分布模式

前提:部署好hadoop的本地模式
点击设置hadoop的本地模式

伪分布模式的部署主要是将下面的参数文件的配置参数进行更改。

hadoop-env.sh

注:如果在本地模式已经配置完成,这个文件则不需要重复配置。

路径:/root/training/hadoop-2.7.3/etc/hadoop($HADOOP_HOME/etc/hadoop)

更改第25行 export JAVA_HOME=/root/training/jdk1.8.0_181

hdfs-site.xml

进入 /root/training/hadoop-2.7.3/etc/hadoop/ 路径找到 hdfs-site.xml 文件进行编辑。

java 复制代码
vi hdfs-site.xml

将下面xml代码添加该文件

xml 复制代码
<!--数据块的冗余度,默认是3-->
<!--一般来说,数据块冗余度跟数据节点的个数一致,最大不超过3-->
<!--由于这是伪分布模式,所以这里冗余度设置为1-->
<property>
		<name>dfs.replication</name>
		<value>1</value>
</property>

core-site.xml

需要在hadoop目录下,先创建出tmp文件,作为HDFS对应的操作系统目录。

java 复制代码
mkdir /root/training/hadoop-2.7.3/tmp

编辑操作与上面文件相同,则不演示。

xml 复制代码
<!--配置NameNode的地址-->
<!--9000是RPC通信的端口-->
<property>
		<name>fs.defaultFS</name>
		<value>hdfs://bigdata111:9000</value>
</property>

 <!--HDFS对应的操作系统目录-->
<!--默认值是Linux的tmp目录-->
<property>
		<name>hadoop.tmp.dir</name>
		<value>/root/training/hadoop-2.7.3/tmp</value>
</property>

mapred-site.xml

这个文件默认没有,需要我们先复制

java 复制代码
cp mapred-site.xml.template mapred-site.xml
xml 复制代码
<!--配置MapReduce运行的框架是Yarn-->
<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
</property>

yarn-site.xml

xml 复制代码
<!--配置ResourceManager的地址-->
<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>bigdata111</value>
</property>

<!--MapReduce运行的方式是洗牌-->
<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
</property>

对NameNode进行格式化

执行下面这条命名

java 复制代码
hdfs namenode -format

成功则出现下面这句话。

启动Hadoop

java 复制代码
 start-all.sh

需要输入4次密码和yes。

至此部署完成,下面进行测试!

对部署是否完成进行测试

将本地文件上传到hdfs

进入/root/training/hadoop-2.7.3/share/hadoop/mapreduce/

java 复制代码
hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output/wc

停止集群

java 复制代码
stop-all.sh

也需要输入4次密码,输入密码太麻烦,所以我们还需要配置免密码模式

免密码模式

免密码模式的原理(重要)

免密码模式的配置

java 复制代码
ssh-keygen -t rsa
java 复制代码
ssh-copy-id -i .ssh/id_rsa.pub root@bigdata111

注:root@bigdata111 是你当前的主机名


免密码模式配置完成!

相关推荐
暴躁小师兄数据学院2 小时前
【AI大数据工程师特训笔记】第16讲:大数据环境安装
大数据·hadoop·笔记·flink·spark·database
豆豆2 小时前
垂直行业门户网站搭建解决方案与落地实操指南
大数据·cms·pageadmin·自定义模型·垂直门户·行业建站·站群建设
Elastic 中国社区官方博客3 小时前
Kibana:使用 AI Chat 及 MCP 轻松创建 AI 原生仪表板
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·信息可视化
Thomas_YXQ3 小时前
Unity无GC读取图片与网格完整方案
大数据·人工智能·unity·微信·产品运营
189228048614 小时前
NV023固态MT29F16T08GWLCEJ9-QBES:C
大数据·服务器·人工智能·科技·缓存
真上帝的左手4 小时前
19. 大数据-数仓建设解决方案
大数据·数据仓库
可乐ea6 小时前
【知识获取与分享社区项目 | 项目日记第 21 天】索引构建与联想建议:Outbox 增量更新 + Completion Suggester
java·大数据·mysql·elasticsearch·搜索引擎
CoCo的编程之路6 小时前
2026全栈演进:使用前端开发助手进行项目重构的最佳工具
大数据·前端·人工智能·ai编程·comate
BlockWay6 小时前
WEEX Labs 周度观察:微软-OpenAI 合作调整与AI 多云趋势
大数据·人工智能·算法·安全·microsoft
andafaAPS7 小时前
安达发|工艺品aps自动排产排程排单软件:告别生产“一团乱麻“
大数据·数据库·人工智能·安达发aps·计划排产软件·自动排单软件