【Flink学习】(一)初识 Flink,大数据实时计算核心认知

本篇开始,博主整理Flink相关内容,帮助大家建立 Flink 整体认知,分清实时与离线计算差异,零基础快速入门。官方网址:https://flink.apache.org/

Apache Flink 是一款分布式、高性能、高吞吐、低延迟的开源流式计算引擎,支持流处理、批处理,目前大数据实时领域主流框架。

二、流处理与批处理

批处理

数据全部采集完成后统一计算,延迟高,代表框架 Hive、Spark Core

流处理

数据源源不断产生,来一条处理一条,秒级 / 毫秒级延迟,适合实时统计、实时监控

支持流批一体,一套代码适配离线、实时场景

内置精准时间语义,完美解决数据乱序问题

原生支持状态管理,可存储计算中间数据

强大容错机制,任务宕机自动恢复不丢数据

高可用、易扩展,支持大规模集群部署

实时大屏统计

实时日志分析

电商实时订单统计

用户行为实时分析

物联网实时数据处理等

DataStream API

底层代码 API,灵活度高,适合复杂自定义逻辑开发

类 SQL 语法,上手简单,开发效率高,企业数仓主流使用

六、学习前期准备

基础要求 :掌握 Java 基础、了解 Kafka 基础概念
环境准备:JDK1.8、Maven3.6+、IDEA 开发工具

相关推荐
Databend2 小时前
2KB histogram 背后:Databend 如何低成本追踪长尾延迟
大数据·数据分析·agent
大大大大晴天3 小时前
Flink JDBC Connector 深度解析:从原理到最佳实践
flink
Databend4 小时前
从湖仓升级为 Agent 时代的数据控制面,Snowflake 和 Databricks 有哪些布局
大数据·数据库·agent
阿里云大数据AI技术1 天前
StarRocks x Fluss x Paimon湖流一体方案:构建秒级响应、湖流一体的实时数据引擎
大数据·人工智能
Databend1 天前
Agent 轨迹分析与归因的数据工程实践
大数据·数据库·agent
喵个咪1 天前
Go Wind UBA 拆解系列 - 架构总览:三服务、数据流与契约优先
大数据·后端·go
喵个咪1 天前
Go Wind UBA 拆解系列 - 多租户与安全:两套隔离机制的边界
大数据·后端·go
喵个咪1 天前
Go Wind UBA 拆解系列 - OLAP 与 SQL 硬核:25 个分析模型怎么落地
大数据·后端·go
喵个咪1 天前
Go Wind UBA 拆解系列 - SDK 与采集层:从浏览器到 Kafka
大数据·后端·go
一条鱼丶1 天前
深入理解 Flink Watermark——流数据处理中的乱序问题解决方案
flink