其实吧我不太想写flink,因为线上经验确实不多,这也是我需要补的地方,没有条件创造条件,先来一篇吧
flink:
高性能 低延迟 流批一体的分布式计算框架
基于事件时间 对实时数据精准处理 快速响应
支持批处理,高效离线分析和数据挖掘 数据仓库的引擎
丰富数据源/接收器,集成多种数据存储格式和源,比较常见就是咱们今天的主题hive了
checkpoint恢复机制,故障恢复快速恢复计算任务
分布式弹性扩展,据业务灵活增加/减少计算资源,保证任务稳定性和高效性
hive:
hadoop数据仓库工具,将结构化数据映射为表,查询和管理