二百一十三、Flume——Flume拓扑结构介绍

一、目的

最近在看尚硅谷的Flume资料,看到拓扑结构这一块,觉得蛮有意思,于是整理一下Flume的4种拓扑结构

二、拓扑结构

(一)简单串联

1、结构含义

这种模式是将多个flume顺序连接起来了,从最初的source开始到最终sink传送的目的存储系统。

2、结构特征

此模式不建议桥接过多的flume数量, flume数量过多不仅会影响传输速率,而且一旦传输过程中某个节点flume宕机,会影响整个传输系统。

(二)复制和多路复用

1、结构含义

Flume 支持将事件流向一个或者多个目的地。

2、结构特征

这种模式可以将相同数据复制到多个channel 中,或者将不同数据分发到不同的 channel 中,sink 可以选择传送到不同的目的地

(三)负载均衡和故障转移

1、结构含义

Flume支持使用将多个sink逻辑上分到一个sink组

2、结构特征

sink组配合不同的SinkProcessor可以实现负载均衡和错误恢复的功能

(四)聚合

1、结构含义

这种模式是我们最常见的,也非常实用。日常web应用通常分布在上百个服务器,大者甚至上千个、上万个服务器产生的日志,处理起来也非常麻烦。

2、结构特征

用flume的这种组合方式能很好的解决这一问题,每台服务器部署一个 flume 采集日志,传送到一个集中收集日志的flume,再由此flume上传到hdfs、hive、hbase等,进行日志分析。

以上就是Flume的4种拓扑结构介绍,当然,项目中Flume到底选择哪种拓扑结构还是需要根据项目的实际情况因地制宜!

相关推荐
闯闯桑3 分钟前
Scala 中的隐式转换
大数据·scala
用户Taobaoapi20142 小时前
淘宝商品列表查询 API 接口详解
大数据
涛思数据(TDengine)3 小时前
taosd 写入与查询场景下压缩解压及加密解密的 CPU 占用分析
大数据·数据库·时序数据库·tdengine
DuDuTalk3 小时前
DuDuTalk接入DeepSeek,重构企业沟通数字化新范式
大数据·人工智能
大数据追光猿3 小时前
Qwen 模型与 LlamaFactory 结合训练详细步骤教程
大数据·人工智能·深度学习·计算机视觉·语言模型
Elastic 中国社区官方博客4 小时前
使用 Elastic-Agent 或 Beats 将 Journald 中的 syslog 和 auth 日志导入 Elastic Stack
大数据·linux·服务器·elasticsearch·搜索引擎·信息可视化·debian
对许5 小时前
Hadoop的运行模式
大数据·hadoop·分布式
天空卫士6 小时前
AI巨浪中的安全之舵:天空卫士助力人工智能落地远航
大数据·人工智能·安全·网络安全·数据安全
SelectDB技术团队8 小时前
云原生时代的架构革新,Apache Doris 存算分离如何实现弹性与性能双重提升
大数据·数据库·云原生·doris·存算分离
神秘打工猴11 小时前
数据仓库为什么要分层
大数据·数据仓库·spark