本篇开始,博主整理Flink相关内容,帮助大家建立 Flink 整体认知,分清实时与离线计算差异,零基础快速入门。官方网址:https://flink.apache.org/
一、什么是 Flink
Apache Flink 是一款分布式、高性能、高吞吐、低延迟的开源流式计算引擎,支持流处理、批处理,目前大数据实时领域主流框架。

二、流处理与批处理
批处理
数据全部采集完成后统一计算,延迟高,代表框架 Hive、Spark Core
流处理
数据源源不断产生,来一条处理一条,秒级 / 毫秒级延迟,适合实时统计、实时监控
三、Flink 核心优势
支持流批一体,一套代码适配离线、实时场景
内置精准时间语义,完美解决数据乱序问题
原生支持状态管理,可存储计算中间数据
强大容错机制,任务宕机自动恢复不丢数据
高可用、易扩展,支持大规模集群部署
四、Flink 应用场景
实时大屏统计
实时日志分析
电商实时订单统计
用户行为实时分析
物联网实时数据处理等
五、Flink 两大编程 API
DataStream API
底层代码 API,灵活度高,适合复杂自定义逻辑开发
Flink SQL
类 SQL 语法,上手简单,开发效率高,企业数仓主流使用
六、学习前期准备
基础要求 :掌握 Java 基础、了解 Kafka 基础概念
环境准备:JDK1.8、Maven3.6+、IDEA 开发工具