半小时速通flume-flume概述

STONE_KKK2025-01-27 19:51

文章目录

1.Flume概述
2.Flume架构
- 1.Agent
- 2.Source
- 3.Sink
- 4.Channel
- 5.Event

1.Flume概述

Flume是Cloudera提供的一个高可用，高可靠的，分布式海量数据日志采集，聚合，传输系统。基于流式架构，动态实现，上传一条采集一条。

企业开发，flume-->kafka集群-->hdfs
flume动态采集---实时；若做离线业务，完全可以使用put命令

2.Flume架构

三个关键组件：Source ，Channel，Sink
Channel做缓冲，原因是Source，Sink速度不一致。

1.Agent

agent是一个JVM进程，它以时间的形式将数据从源头送至目的。
三个部分组成Source、Sink、Channel

2.Source

内部有很多的类型，不同的类型就是对接不同的数据源的

3.Sink

Sink指的是传输落点；也就是将数据传输到哪

logger是打印到控制台，测试常用。

4.Channel

做缓冲的地方；
Memory Channel、File Channel、Kafka Channel

存到内存和磁盘各有优略；安全性和速度角度考虑。

5.Event

Event表示将我们的数据做了一次序列化

上一篇：Centos7系统php8编译安装ImageMagick/Imagick扩展教程整理

下一篇：半小时速通flume-flume正文学习

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 10【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……