- 实时数仓中,为什么没有零点漂移问题?
- 因为flink直接取的事件时间
- 用kafka是为了速度快,并且数据不丢,那为什么既用了kafkachannel,也用了kafka,而不只用kafkachannel呢?
- 因为需要削峰填谷
- 离线数仓中,为什么用两个flume,一个kafka,直接用taildirsource,kafkachannel,hdfssink不行吗?
- 不行
- kafka可以削峰填谷
- 如果用kafkachannel,那么数据写到kafka,只剩event,没有header,无法解决零点漂移问题,而多加一个flume,可以在kafkasource中添加拦截器。
离线数仓中,为什么用两个flume,一个kafka
青云游子2023-08-03 12:44
相关推荐
黎阳之光7 小时前
黎阳之光:以视频孪生重构智慧防火,打造“天空地人智”一体化森林防火新范式Daydream.V8 小时前
Python Flask超全入门实战教程|从零基础到项目部署小钻风336611 小时前
ZooKeeper + Kafka 集群搭建实战记录SmartBrain11 小时前
AI全栈开发(SDD):慢病管理系统工程级设计zandy101112 小时前
2026 BI平台与数据中台融合架构实践:从数据烟囱到统一智能数据层金智维科技官方13 小时前
圆桌对话:从流程自动化到智能流程,AI落地的下一站在哪里?Volunteer Technology14 小时前
集群基础环境搭建(二)郑小憨14 小时前
zookeeper内部原理 (进阶介绍 三)厌灵泽(后端小白)14 小时前
Windows11本地安装Zookeeper(最新)小江的记录本14 小时前
【Kafka核心】Kafka 3.0+ KRaft模式(替代ZooKeeper)核心原理与优势