(二十四)大数据实战——Flume数据流监控之Ganglia的安装与部署

前言

本节内容我们主要介绍一下Flume数据流的监控工具Ganglia。Ganglia是一个开源的分布式系统性能监控工具。它被设计用于监视大规模的计算机群集(包括集群、网格和云环境),以便收集和展示系统和应用程序的性能数据。Ganglia 可以轻松地扩展到数千台计算机节点,并支持跨多个数据中心进行分布式监控。Ganglia 使用高效的多播通信协议和紧凑的数据格式,以最小化对网络和系统资源的影响。Ganglia 提供实时监控和报告功能,可以显示关键指标(如 CPU 使用率、内存使用率、网络流量等)的实时数据和历史趋势。Ganglia 提供直观的 Web 界面,可以通过图表和图形方式展示系统性能数据,方便用户进行可视化分析。Ganglia 支持插件机制,可以扩展其功能并与其他工具和服务集成。

正文

  • 服务规划
hadoop101 hadoop102 hadoop103
gweb
gmetad
gmod gmod gmod
[Ganglia]
  • Ganglia组件说明

gmond(Ganglia Monitoring Daemon):是一种轻量级服务,安装在每台需要收集指标数据的节点主机上。使用 gmond,你可以很容易收集很多系统指标数据,如 CPU、内存、磁盘、 网络和活跃进程的数据等。

gmetad(Ganglia Meta Daemon):整合所有信息,并将其以 RRD 格式存储至磁盘的服务。

gweb(Ganglia Web)Ganglia :可视化工具,gweb 是一种利用浏览器显示 gmetad 所存储数据的 PHP前端。在Web界面中以图表方式展现集群的运行状态下收集的多种不同指标数 据。

  • 在hadoop101、hadoop102、hadoop103分别安装epel-release
  • 命令:sudo yum -y install epel-release
  • 在hadoop101上安装ganglia-gmetad、ganglia-web、ganglia-gmond
  • 命令:

sudo yum -y install ganglia-gmetad

sudo yum -y install ganglia-gmond

sudo yum -y install ganglia-web

  • 在hadoop102和hadoop103上安装ganglia-gmond
  • 命令:

sudo yum -y install ganglia-gmond

  • 在hadoop101服务器修改/etc/httpd/conf.d/ganglia.conf配置文件
  • 使得该网段地址192.168.10.0/24都能访问ganglia-web
  • 在hadoop101服务器修改/etc/ganglia/gmetad.conf配置文件
  • 修改元数据的存储位置
  • 在hadoop101、hadoop102、hadoop 103 修改配置文件/etc/ganglia/gmond.conf
  • 修改hadoop101的gmond.conf配置
  • 同步配置到hadoop102和hadoop103
  • 将hadoop101配置文件/etc/selinux/config中的SELINUX修改为disabled
  • 启动ganglia的监控服务
  • 在hadoop101、hadoop02、hadoop103启动gmond服务:sudo systemctl start gmond
  • 在hadoop101启动httpd和gmetad服务
  • 访问ganglia的web端页面

  • 开启一个flume监控任务,查看ganglia的web端页面查看监控指标
  • 在hadoop101服务器上启动一个flume监控任务

    bin/flume-ng agent
    -c conf/
    -n a1
    -f job/job-netcat-flume-console.conf
    -Dflume.root.logger=INFO,console
    -Dflume.monitoring.type=ganglia
    -Dflume.monitoring.hosts=hadoop101:8649

  • 图例说明

|---------------------------|----------------------------|
| EventPutAttemptCount | source 尝试写入 channel 的事件总数量 |
| EventPutSuccessCount | 成功写入 channel 且提交的事件总数量 |
| EventTakeAttemptCount | sink 尝试从 channel 拉取事件的总数量。 |
| EventTakeSuccessCount | sink 成功读取的事件的总数量 |
| StartTime | channel 启动的时间(毫秒) |
| StopTime | channel 停止的时间(毫秒) |
| ChannelSize | 目前 channel 中事件的总数量 |
| ChannelFillPercentage | channel 占用百分比 |
| ChannelCapacity | channel 的容量 |
[图例说明]

结语

关于Flume数据流监控之Ganglia的安装与部署内容到这里就结束了,我们下期见。。。。。。

相关推荐
果粒蹬i11 分钟前
Elasticsearch 单机部署实测:安装流程、常见坑点与远程访问配置
大数据·elasticsearch·搜索引擎
AC赳赳老秦15 分钟前
OpenClaw数据库高效操作指南:MySQL/PostgreSQL批量处理与数据迁移实战
大数据·数据库·mysql·elasticsearch·postgresql·deepseek·openclaw
小王毕业啦21 分钟前
2006-2023年 省级-建成区绿化覆盖率数据(xlsx)
大数据·人工智能·数据挖掘·数据分析·社科数据·实证分析·经管数据
AEIC学术交流中心2 小时前
【快速EI检索 | SPIE出版】第六届中国膜计算论坛暨2026年人工智能、大数据与电气自动化国际学术会议(CWMC&AIBDE 2026)
大数据·人工智能·量子计算
历程里程碑2 小时前
二叉树---二叉树的中序遍历
java·大数据·开发语言·elasticsearch·链表·搜索引擎·lua
AC赳赳老秦3 小时前
OpenClaw text-translate技能:多语言批量翻译,解决跨境工作沟通难题
大数据·运维·数据库·人工智能·python·deepseek·openclaw
Elastic 中国社区官方博客4 小时前
使用 Elasticsearch + Jina embeddings 进行无监督文档聚类
大数据·人工智能·elasticsearch·搜索引擎·全文检索·jina
我是章汕呐4 小时前
政策评估的“黄金标准”:DID模型从原理到Stata实操
大数据·人工智能·经验分享·算法·回归
Data-Miner4 小时前
54页可编辑PPT | 数据中台建设方案汇报
大数据·人工智能
皮皮学姐分享-ppx5 小时前
1447上市公司数字化转型速度的计算(2000-2022年)
大数据·人工智能