Centos7搭建Apache Storm 集群运行环境

文章目录

    • [1. 安装 Java](#1. 安装 Java)
    • [2. 下载并解压 Storm](#2. 下载并解压 Storm)
    • [3. 配置环境变量](#3. 配置环境变量)
    • [4. 配置 ZooKeeper](#4. 配置 ZooKeeper)
    • [5. 配置 Storm](#5. 配置 Storm)
    • [6. 启动 Storm 集群](#6. 启动 Storm 集群)
    • [7. 验证](#7. 验证)

1. 安装 Java

Storm 运行在 Java 平台上,因此需要先安装 Java。你可以使用以下命令安装 OpenJDK 8:

shell 复制代码
sudo yum install java-1.8.0-openjdk

2. 下载并解压 Storm

你可以从 Storm 的官方网站下载 Storm。在本教程中,我们将使用 Storm 2.2.0 版本。你可以使用以下命令下载 Storm:

shell 复制代码
wget https://archive.apache.org/dist/storm/apache-storm-2.2.0/apache-storm-2.2.0.tar.gz

下载完成后,你可以使用以下命令解压 Storm:

shell 复制代码
tar -xvf apache-storm-2.2.0.tar.gz

解压完成后,你可以将 Storm 移动到 /usr/local 目录下:

shell 复制代码
sudo mv apache-storm-2.2.0 /usr/local/

3. 配置环境变量

为了方便使用 Storm,你需要设置一些环境变量。首先,你需要打开 /etc/profile 文件:

shell 复制代码
sudo nano /etc/profile

在文件的末尾添加以下内容:

shell 复制代码
export STORM_HOME=/usr/local/apache-storm-2.2.0
export PATH=$PATH:$STORM_HOME/bin

保存后,使用以下命令使环境变量生效:

shell 复制代码
source /etc/profile

4. 配置 ZooKeeper

Storm 需要使用 ZooKeeper 来协调集群中的节点。你可以使用以下命令安装 ZooKeeper:

shell 复制代码
sudo yum install zookeeper

安装完成后,你需要启动 ZooKeeper 服务:

shell 复制代码
sudo systemctl start zookeeper

为了让 ZooKeeper 服务在系统启动时自动启动,你可以使用以下命令将其添加到系统服务中:

shell 复制代码
sudo systemctl enable zookeeper

5. 配置 Storm

Storm 的配置文件位于 $STORM_HOME/conf 目录下。你可以使用以下命令进入该目录:

shell 复制代码
cd $STORM_HOME/conf

在该目录下,有三个文件需要进行配置:

storm.yaml

该文件是 Storm 的主要配置文件,你可以使用以下命令创建该文件:

shell 复制代码
sudo cp storm.yaml.example storm.yaml

然后使用以下命令打开该文件:

shell 复制代码
sudo nano storm.yaml

在文件中添加以下内容:

shell 复制代码
storm.zookeeper.servers:
  - "localhost"

nimbus.seeds: ["localhost"]

storm.local.hostname: "localhost"

自定义 storm.yaml

一般我们只需要配置上面的就ok了,如果你想自定义一些参数可以参考下面的,我加了注释方便于你理解。

yaml 复制代码
# 配置 ZooKeeper 服务器地址
storm.zookeeper.servers:
  - "localhost"

# 指定 Storm 集群所使用的本地目录
storm.local.dir: "/mnt/storm"

# 指定 Nimbus 的种子节点地址
nimbus.seeds: ["localhost"]

# 指定 Storm 使用的 Thrift 传输插件
storm.thrift.transport: "org.apache.storm.security.auth.SimpleTransportPlugin"

# 指定 Storm 使用的消息传输插件
storm.messaging.transport: "org.apache.storm.messaging.netty.Context"

# 指定 Storm 消息服务器使用的工作线程数
storm.messaging.netty.server_worker_threads: 1

# 指定 Storm 消息客户端使用的工作线程数
storm.messaging.netty.client_worker_threads: 1

# 指定 Storm 消息缓冲区的大小
storm.messaging.netty.buffer_size: 1024

# 指定 Storm 消息传输失败时的最大重试次数
storm.messaging.netty.max_retries: 10

# 指定 Storm 消息传输重试时的最大等待时间
storm.messaging.netty.max_wait_ms: 1000

# 指定 Storm 消息传输重试时的最小等待时间
storm.messaging.netty.min_wait_ms: 100

storm-env.sh

该文件是 Storm 的环境变量配置文件,你可以使用以下命令创建该文件:

shell 复制代码
sudo cp storm-env.sh.example storm-env.sh

然后使用以下命令打开该文件:

shell 复制代码
sudo nano storm-env.sh

在文件中添加以下内容:

shell 复制代码
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk

上述配置将 Java 的安装路径设置为 /usr/lib/jvm/java-1.8.0-openjdk

logback/cluster.xml

该文件是 Storm 的日志配置文件,你可以使用以下命令打开该文件:

shell 复制代码
sudo nano logback/cluster.xml

找到以下内容:

xml 复制代码
<appender name="FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">
  <file>${storm.log.dir}/nimbus.log</file>
  <rollingPolicy class="ch.qos.logback.core.rolling.TimeBasedRollingPolicy">
    <fileNamePattern>${storm.log.dir}/nimbus.log.%d{yyyy-MM-dd-HH}</fileNamePattern>
    <maxHistory>30</maxHistory>
  </rollingPolicy>
  <encoder>
    <pattern>%d{yyyy-MM-dd HH:mm:ss.SSS} %-5level %logger{36} - %msg%n</pattern>
  </encoder>
</appender>

将其中的 ${storm.log.dir} 替换为 /var/log/storm,这样 Storm 的日志将会被记录在 /var/log/storm/nimbus.log 文件中。

6. 启动 Storm 集群

在完成以上配置后,你可以使用以下命令启动 Storm 集群:

启动了 Nimbus、Supervisor 和 UI 三个进程。& 符号表示将进程放到后台运行。

shell 复制代码
storm nimbus &
storm supervisor &
storm ui &

7. 验证

已经成功地在 CentOS 7 上安装和配置了 Storm 环境,并启动了 Storm 集群。可以访问 http://localhost:8080/ 来查看 Storm UI

相关推荐
小伍_Five1 小时前
spark数据处理练习题详解【下】
java·大数据·spark·scala
你的坚持终将美好,1 小时前
elasticsearch kibana ik 各版本下载
大数据·elasticsearch·搜索引擎
Code哈哈笑2 小时前
【图书管理系统】用户注册系统实现详解
数据库·spring boot·后端·mybatis
用手手打人2 小时前
SpringBoot(一)--- Maven基础
spring boot·后端·maven
Pluto_CSND2 小时前
hbase shell的常用命令
大数据·数据库·hbase
API_technology3 小时前
阿里巴巴 1688 数据接口开发指南:构建自动化商品详情采集系统
大数据·运维·数据挖掘·自动化
菠萝崽.4 小时前
Elasticsearch进阶篇-DSL
大数据·分布式·elasticsearch·搜索引擎·全文检索·jenkins·springboot
Code哈哈笑4 小时前
【基于Spring Boot 的图书购买系统】深度讲解 用户注册的前后端交互,Mapper操作MySQL数据库进行用户持久化
数据库·spring boot·后端·mysql·mybatis·交互
Javatutouhouduan4 小时前
线上问题排查:JVM OOM问题如何排查和解决
java·jvm·数据库·后端·程序员·架构师·oom
多多*4 小时前
Spring之Bean的初始化 Bean的生命周期 全站式解析
java·开发语言·前端·数据库·后端·spring·servlet