技术栈
flink
linweidong
8 小时前
大数据
·
flink
·
spark
·
实时数仓
·
调度器
·
离线数仓
·
数据面试
《Spark/Flink/Doris离线&实时数仓开发》目录
欢迎加入《Spark/Flink/Doris离线&实时数仓开发》付费专栏!本专栏专为大数据工程师、数据分析师及准备大数据面试的求职者量身打造,聚焦Spark、Flink、Doris等核心技术,覆盖离线与实时数仓开发的全流程。无论你是想快速上手项目、提升技术能力,还是在面试中脱颖而出,这里都能为你提供系统化、实战化、可落地的内容。
Kookoos
17 小时前
大数据
·
flink
·
.net
·
apache
·
abp vnext
ABP VNext + Apache Flink 实时流计算:打造高可用“交易风控”系统
在金融 💰、电商 🛒、IoT 🌐 等高频交互系统中,越来越多的场景需要“实时发现问题并响应”。💡 图示展示了各组件之间的数据流向,实现消息解耦和高可用。
北漂老男孩
3 天前
大数据
·
flink
·
学习方法
Flink 常用算子详解与最佳实践
Apache Flink 作为新一代流式计算引擎,以其高吞吐、低延迟和强大的状态管理能力,成为大数据实时处理领域的首选。在实际开发中,Flink 的各种算子(Operator)构成了数据处理的核心。本文将详细讲解 Flink 的常用算子,包括其原理、典型应用场景、详细代码示例、优化建议、学习方法及权威参考链接。
涤生大数据
3 天前
flink
·
kafka
·
apache
·
实时
Kafka Streams 和 Apache Flink 的无状态流处理与有状态流处理
Kafka Streams 和 Apache Flink 与数据库和数据湖相比的无状态和有状态流处理的概念和优势。
北漂老男孩
3 天前
大数据
·
架构
·
flink
Flink运行架构及并行度设置
实时大数据处理的本质,是利用有限的资源实现高并发、低延迟的任务执行。Flink作为流批一体的分布式计算引擎,其运行架构和并行度机制是理解Flink性能和资源利用率的核心。本文将通过原理讲解、源码细节、实用口诀和案例演示,帮助你全面掌握Flink的运行机制与并行度设置。
世润
4 天前
大数据
·
flink
Flink基本理解
是一个框架和分布式处理引擎,用于对无界或有界数据流进行有状态计算。定义流的开始,没有定义流的结束,会无休止的产生数据,无界流的数据必须持续处理,即数据被摄取后需要立刻处理。我们不能等到所有数据都达到再处理,因为输入是无限的。
北漂老男孩
4 天前
java
·
大数据
·
flink
Flink基于Yarn多种启动方式详解
随着大数据实时计算需求的日益增长,Flink已成为业界主流的流处理引擎。而在企业级大数据平台中,资源管理和作业调度一般交由Yarn完成。Flink与Yarn深度集成后,不仅充分利用Hadoop生态资源,还能灵活应对各种作业调度和资源隔离需求。本文将系统介绍Flink on Yarn的多种启动方式、适用场景、配置方法及常见问题。
maozexijr
5 天前
大数据
·
flink
Flink 非确定有限自动机NFA
Flink 是一个用于状态化计算的分布式流处理框架,而非确定有限自动机(NFA, Non-deterministic Finite Automaton)是一种在计算机科学中广泛使用的抽象计算模型,常用于正则表达式匹配、模式识别等领域。
多多洛码代码
5 天前
大数据
·
flink
Flink概述
Apache Flink 是一个开源的流处理框架,专为高吞吐量、低延迟的大规模数据流处理而设计。它支持有状态的计算,能够处理无界数据流和有界数据集。Flink 的核心是一个分布式流数据流引擎,能够在集群上运行,支持多种数据源和数据接收器。
maozexijr
6 天前
大数据
·
flink
Flink CEP是什么?
Apache Flink 的 CEP(Complex Event Processing,复杂事件处理) 是 Flink 提供的一个库,用于在无界数据流中检测符合特定模式的事件组合。
鲁尼的小宝贝
7 天前
java
·
大数据
·
clickhouse
·
flink
·
yarn
基于Flink的数据中台管理平台
基于Flink做的数据中台工程项目。数据从source到clickhouse全流程的验证。集成元数据管、数据资产、数据发现功能,自主管理元数据变更,集成元数据版本管理。
maozexijr
7 天前
javascript
·
算法
·
flink
Flink的时间问题
Apache Flink 中的 时间语义(Time Semantics) 是流处理的核心概念之一。Flink 支持多种时间类型,用于控制窗口计算、事件排序和状态管理等操作。
_abab
7 天前
大数据
·
flink
Flink 核心概念解析:流数据、并行处理与状态
定义:有明确起始和结束时间的数据集合,数据量固定,处理逻辑通常是一次性计算所有数据。典型场景:历史交易数据统计(如月度财务报表)
世润
7 天前
大数据
·
flink
Flink-Yarn运行模式
Yarn上部署的过程是:客户端把Flink应用提交给Yarn的ResourceManager,Yarn的ResourceManager会向Yarn的NodeManager申请容器,在这些容器上,Flink会部署JobManager和TaskManager的实例,从而启动集群,Flink会根据运行在JobManager上的作业所需要的Slot数量动态分配TaskManager资源。
轩昂7K
8 天前
flink
·
kafka
Kafka工具类
KafkaUtil 是一个 Apache Flink 工具类,封装了 Kafka 作为数据源(Source)和数据汇(Sink)的常用操作,简化了 Flink 与 Kafka 集成的开发工作。
maozexijr
9 天前
大数据
·
flink
Flink 并行度的设置
在 Apache Flink 中,并行度(Parallelism) 是控制任务并发执行的核心参数之一。Flink 提供了 多个层级设置并行度的方式,优先级从高到低如下:
maozexijr
9 天前
大数据
·
flink
Flink 数据传输机制
在 Apache Flink 中,数据传输(Data Transmission)机制 是其分布式流处理能力的核心之一。Flink 通过高效的内部数据交换、网络通信和序列化机制,确保任务之间的数据能够高效、可靠地流动。
maozexijr
9 天前
大数据
·
flink
Flink 的水印机制
Apache Flink 的 水印机制(Watermark Mechanism) 主要用于解决 事件时间流中的乱序问题(Out-of-Order Events),确保窗口(Window)能够在合适的时间触发计算,从而提供准确、一致的处理结果。
maozexijr
9 天前
大数据
·
python
·
flink
什么是 Flink Pattern
在 Apache Flink 中,Pattern 是 Flink CEP(Complex Event Processing)模块 的核心概念之一。它用于定义你希望从数据流中检测出的 事件序列模式(Event Sequence Pattern)。
渣渣盟
10 天前
flink
·
kafka
·
scala
Flink流处理:多源传感器数据实时处理,基于Scala使用Flink从不同数据源(集合、文件、Kafka、自定义 Source)读取传感器数据
这段代码是一个基于 Apache Flink 的流处理程序,主要功能是从不同数据源(集合、文件、Kafka、自定义 Source)读取传感器数据,并进行简单的处理和输出。以下是代码的总结和原理拓展: