一、Hadoop 核心目录功能说明表
目录名称 | 核心功能描述 | 关键包含内容 |
---|---|---|
bin 目录 | 存放对 Hadoop 相关服务进行操作的脚本,主要用于日常功能执行与管理 | 操作 HDFS、YARN、MapReduce 等服务的脚本(如 hdfs 、yarn 、mapred 等命令脚本) |
etc 目录 | Hadoop 的核心配置文件目录,用于配置 Hadoop 各组件的运行参数 | Hadoop 核心配置文件(如 core-site.xml 、hdfs-site.xml 、yarn-site.xml 、mapred-site.xml 等) |
lib 目录 | 存放 Hadoop 的本地库,提供底层数据处理支持 | 实现数据压缩与解压缩功能的本地库文件(如支持 Gzip、Snappy 等压缩格式的库) |
sbin 目录 | 存放启动或停止 Hadoop 相关服务的脚本,用于服务生命周期管理 | 服务启停脚本(如 start-dfs.sh 、stop-dfs.sh 、start-yarn.sh 、stop-yarn.sh 等) |
share 目录 | 存放 Hadoop 的依赖资源、文档及示例,用于开发与学习 | 1. 依赖 JAR 包(Hadoop 各组件的核心依赖库) 2. 官方文档(API 文档、使用手册等) 3. 官方案例(用于演示 Hadoop 功能的示例程序) |
二、Hadoop 默认配置文件
默认配置文件 | 文件存放在 Hadoop 的 jar 包中的位置 | 说明 |
---|---|---|
core-default.xml | $HADOOP_HOME/share/hadoop/common/hadoop-common-3.2.1.jar/core-default.xml | 包含 Hadoop 核心模块(如 I/O、序列化等)的默认配置参数 |
hdfs-default.xml | $HADOOP_HOME/share/hadoop/hdfs/hadoop-hdfs-3.2.1.jar/hdfs-default.xml | 包含 HDFS(分布式文件系统)相关的默认配置参数 |
yarn-default.xml | $HADOOP_HOME/share/hadoop/yarn/hadoop-yarn-common-3.2.1.jar/yarn-default.xml | 包含 YARN(资源管理系统)相关的默认配置参数 |
mapred-default.xml | $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-core-3.2.1.jar/mapred-default.xml | 包含 MapReduce(分布式计算框架)相关的默认配置参数 |