- 实时数仓中,为什么没有零点漂移问题?
- 因为flink直接取的事件时间
- 用kafka是为了速度快,并且数据不丢,那为什么既用了kafkachannel,也用了kafka,而不只用kafkachannel呢?
- 因为需要削峰填谷
- 离线数仓中,为什么用两个flume,一个kafka,直接用taildirsource,kafkachannel,hdfssink不行吗?
- 不行
- kafka可以削峰填谷
- 如果用kafkachannel,那么数据写到kafka,只剩event,没有header,无法解决零点漂移问题,而多加一个flume,可以在kafkasource中添加拦截器。
离线数仓中,为什么用两个flume,一个kafka
青云游子2023-08-03 12:44
相关推荐
科技小花2 小时前
全球化深水区,数据治理成为企业出海 “核心竞争力”weixin_370976353 小时前
AI的终极赛跑:进入AGI,还是泡沫破灭?小江的记录本5 小时前
【Kafka核心】架构模型:Producer、Broker、Consumer、Consumer Group、Topic、Partition、Replica一切皆是因缘际会5 小时前
AI数字分身的底层原理:破解意识、自我与人格复刻的核心难题上海光华专利事务所5 小时前
跨境电商商标专利管理平台Elastic 中国社区官方博客6 小时前
ES|QL METRICS_INFO 和 TS_INFO:为你的时间序列数据建立目录jinanwuhuaguo7 小时前
(第二十七篇)OpenClaw四月的演化风暴:OpenClaw 2026年4月全版本更新的文明级解读清晨0018 小时前
工业生产实时数据获取方案-TDengine极创信息8 小时前
信创产品认证怎么做?信创产品测试认证的主要流程Elastic 中国社区官方博客9 小时前
Elastic 和 Cursor 合作 加速 上下文工程 与 coding agents