Hadoop-2.5.2平台环境搭建遇到的问题

文章目录

一、集群环境
二、MySQL
- [2.1 MySQL初始化失败](#2.1 MySQL初始化失败)
- [2.2 MySQL启动报错](#2.2 MySQL启动报错)
- [2.3 启动时报不能打开日志错](#2.3 启动时报不能打开日志错)
- [2.4 mysql启动时pid报错](#2.4 mysql启动时pid报错)
二、Hive
- [2.1 Hive修改core-site.xml文件后刷新权限](#2.1 Hive修改core-site.xml文件后刷新权限)
- [2.2 Hive启动元数据时报错](#2.2 Hive启动元数据时报错)
- [2.3 Hive初始化MySQL报错](#2.3 Hive初始化MySQL报错)
- - [2.3.1 报错信息](#2.3.1 报错信息)
  - [2.3.2 错误原因](#2.3.2 错误原因)
  - [2.3.3 参考文档](#2.3.3 参考文档)
- [2.4 mr shuffle不存在](#2.4 mr shuffle不存在)
- - [2.4.1 报错信息：**`org.apache.hadoop.yarn.exceptions.InvalidAuxServiceException: The auxService:mapreduce_shuffle does not exist`](#2.4.1 报错信息：**org.apache.hadoop.yarn.exceptions.InvalidAuxServiceException: The auxService:mapreduce_shuffle does not exist)
  - [2.4.2 查看yarn任务：](#2.4.2 查看yarn任务：)
  - [2.4.3 问题描述：](#2.4.3 问题描述：)
  - [2.4.4 参考文档](#2.4.4 参考文档)

一、集群环境

复制代码

java-1.8.0-openjdk-1.8.0.181-7.b13.el7
hadoop-2.5.2
spark-2.3.3
hbase-1.3.1
hbase-2.1.0
zookeeper-3.5.5-bin
janusgraph-0.2.0-hadoop2-gremlin
mysql-5.7.27
hive-2.1.1

这两天我配置了mysql和hive，本文记录遇到的问题。

二、MySQL

使用了arm架构下的mysql.tar.gz离线安装。

参考文章：ARM架构部署mysql-5.7.27

文章内容：

复制代码

cd /usr/local

将部署包：mysql-5.7.27-aarch64.tar.gz 上传到 /usr/local 下

tar xvf mysql-5.7.27-aarch64.tar.gz

mv /usr/local/mysql-5.7.27-aarch64 /usr/local/mysql

mkdir -p /usr/local/mysql/logs

ln -sf /usr/local/mysql/my.cnf /etc/my.cnf

cp -rf /usr/local/mysql/extra/lib* /usr/lib64/

mv /usr/lib64/libstdc++.so.6 /usr/lib64/libstdc++.so.6.old

ln -s /usr/lib64/libstdc++.so.6.0.24 /usr/lib64/libstdc++.so.6

groupadd mysql

useradd -g mysql mysql

chown -R mysql:mysql /usr/local/mysql

cp -rf /usr/local/mysql/support-files/mysql.server /etc/init.d/mysqld

chmod +x /etc/init.d/mysqld

systemctl enable mysqld

vim /etc/profile

export MYSQL_HOME=/usr/local/mysql

export PATH=$PATH:$MYSQL_HOME/bin

source /etc/profile

mysqld --initialize-insecure --user=mysql --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data

systemctl start mysqld

systemctl status mysqld



移动文件 mv /usr/local/mysql-5.7.27-aarch64 /usr/local/mysql

创建logs目录 mkdir -p /usr/local/mysql/logs

ln -sf a b 建立软连接，b指向a:ln -sf /usr/local/mysql/my.cnf /etc/my.cnf

cp是linux里的拷贝命令-r 是用于目录拷贝时的递归操作-f 是强制覆盖:cp -rf /usr/local/mysql/extra/lib* /usr/lib64/

创建mysql组:ln -s /usr/lib64/libstdc++.so.6.0.24 /usr/lib64/libstdc++.so.6

创建mysql用户添加到mysql组:groupadd mysql && useradd -g mysql mysql

将/usr/loca/mysql目录包含所有的子目录和文件，所有者改变为root,所属组改变为mysql:chown -R mysql:mysql /usr/local/mysql

设置开机启动:

cp -rf /usr/local/mysql/support-files/mysql.server /etc/init.d/mysqld

chmod +x /etc/init.d/mysqld

systemctl enable mysqld

添加环境变量:

vim /etc/profile

export MYSQL_HOME=/usr/local/mysql

export PATH=PATH:PATH:PATH:MYSQL_HOME/bin

source /etc/profile

初始化mysql:mysqld --initialize-insecure --user=mysql --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data

开启mysql:systemctl start mysqld

查看状态:systemctl status mysqld

2.1 MySQL初始化失败

重点检查my.cnf文件，所有目录的创建，权限，初始化命令参数。

关于my.cnf的详细介绍参考：MySQL 配置文件 my.cnf / my.ini 逐行解析

原文内容：

复制代码

MySQL 配置文件详解
文件位置: Windows、Linux、Mac 有细微区别，Windows 配置文件是 .ini，Mac/linux 是 .cnf

[Windows]
MySQL\MySQL Server 5.7\my.ini

[Linux / Mac]
/etc/my.cnf
/etc/mysql/my.cnf 
当然我们也可以使用命令来查看 MySQL 默认配置文件位置

mysql --help|grep 'cnf'

[client]
客户端设置。当前为客户端默认参数

port = 3306
默认连接端口为 3306

socket = /tmp/mysql.sock
本地连接的 socket 套接字

default_character_set = utf8
设置字符集，通常使用 uft8 即可

[mysqld_safe]
mysqld_safe 是服务器端工具，用于启动 mysqld，也是 mysqld 的守护进程。当 mysql 被 kill 时，mysqld_safe 负责重启启动它。

open_files_limit = 8192
此为 MySQL 打开的文件描述符限制，它是 MySQL 中的一个全局变量且不可动态修改。它控制着 mysqld 进程能使用的最大文件描述符数量。默认最小值为 1024

需要注意的是这个变量的值并不一定是你在这里设置的值，mysqld 会在系统允许的情况下尽量取最大值。

当 open_files_limit 没有被配置时，比较 max_connections*5 和 ulimit -n 的值，取最大值

当 open_file_limit 被配置时，比较 open_files_limit 和 max_connections*5 的值，取最大值

user = mysql
用户名

log-error  = error.log
错误 log 记录文件

[mysqld]
服务端基本配置

port = 3306
mysqld 服务端监听端口

socket = /tmp/mysql.sock
MySQL 客户端程序和服务器之间的本地通讯指定一个套接字文件

max_allowed_packet  = 16M
允许最大接收数据包的大小，防止服务器发送过大的数据包。

当发出长查询或 mysqld 返回较大结果时，mysqld 才会分配内存，所以增大这个值风险不大，默认 16M，也可以根据需求改大，但太大会有溢出风险。取较小值是一种安全措施，避免偶然出现但大数据包导致内存溢出。

default_storage_engine = InnoDB
创建数据表时，默认使用的存储引擎。这个变量还可以通过 --default-table-type 进行设置

max_connections  = 512
最大连接数，当前服务器允许多少并发连接。默认为 100，一般设置为小于 1000 即可。太高会导致内存占用过多，MySQL 服务器会卡死。作为参考，小型站设置 100 - 300

max_user_connections = 50
用户最大的连接数，默认值为 50 一般使用默认即可。

thread_cache_size = 64
线程缓存，用于缓存空闲的线程。这个数表示可重新使用保存在缓存中的线程数，当对方断开连接时，如果缓存还有空间，那么客户端的线程就会被放到缓存中，以便提高系统性能。我们可根据物理内存来对这个值进行设置，对应规则 1G 为 8；2G 为 16；3G 为 32；4G 为 64 等。

Query Cache
query_cache_type = 1
设置为 0 时，则禁用查询缓存（尽管仍分配query_cache_size个字节的缓冲区）。
设置为 1 时 ，除非指定SQL_NO_CACHE，否则所有SELECT查询都将被缓存。
设置为 2 时，则仅缓存带有SQL CACHE子句的查询。
请注意，如果在禁用查询缓存的情况下启动服务器，则无法在运行时启用服务器。

query_cache_size = 64M
缓存select语句和结果集大小的参数。

查询缓存会存储一个select查询的文本与被传送到客户端的相应结果。

如果之后接收到一个相同的查询，服务器会从查询缓存中检索结果，而不是再次分析和执行这个同样的查询。

如果你的环境中写操作很少，读操作频繁，那么打开query_cache_type=1，会对性能有明显提升。如果写操作频繁，则应该关闭它（query_cache_type=0）。

Session variables  sort_buffer_size = 2M
MySQL 执行排序时，使用的缓存大小。增大这个缓存，提高 group by，order by 的执行速度。

tmp_table_size = 32M
HEAP 临时数据表的最大长度，超过这个长度的临时数据表 MySQL 可根据需求自动将基于内存的 HEAP 临时表改为基于硬盘的 MyISAM 表。我们可通过调整 tmp_table_size 的参数达到提高连接查询速度的效果。

read_buffer_size  = 128k
MySQL 读入缓存的大小。如果对表对顺序请求比较频繁对话，可通过增加该变量值以提高性能。

read_rnd_buffer_size = 256k
用于表的随机读取，读取时每个线程分配的缓存区大小。默认为 256k ，一般在 128 - 256k之间。在做 order by 排序操作时，会用到 read_rnd_buffer_size 空间来暂做缓冲空间。

join_buffer_size  = 128k
程序中经常会出现一些两表或多表 Join （联表查询）的操作。为了减少参与 Join 连表的读取次数以提高性能，需要用到 Join Buffer 来协助 Join 完成操作。当 Join Buffer 太小时，MySQL 不会将它写入磁盘文件。和 sort_buffer_size 一样，此参数的内存分配也是每个连接独享。

table_definition_cache = 400
限制不使用文件描述符存储在缓存中的表定义的数量。

table_open_cache   = 400
限制为所有线程在内存中打开的表数量。

MySQL 错误日志设置
log_error = error.log log_warnings = 2
log_warnings 为0， 表示不记录告警信息。
log_warnings 为1， 表示告警信息写入错误日志。
log_warnings 大于1， 表示各类告警信息，例如有关网络故障的信息和重新连接信息写入错误日志。
慢查询记录
slow_query_log_file = slow.log slow_query_log  = 0 log_queries_not_using_indexes  = 1 long_query_time = 0.5 min_examined_row_limit = 100
slow_query_log ：全局开启慢查询功能。
slow_query_log_file ：指定慢查询日志存储文件的地址和文件名。
log_queries_not_using_indexes：无论是否超时，未被索引的记录也会记录下来。
long_query_time：慢查询阈值（秒），SQL 执行超过这个阈值将被记录在日志中。
min_examined_row_limit：慢查询仅记录扫描行数大于此参数的 SQL。

2.2 MySQL启动报错

报错内容：
Job for mysqld.service failed because the control process exited with error code. See "systemctl status mysqld.service" and "journalctl -xe" for details.
解决思路：

mysqld.pid目录权限问题，请把我们组群mysql:mysql给到权限，这个组群是我们安装mysql时创建的。
参考文章：