技术栈
flink
lixia0417mul2
11 小时前
java
·
spring
·
flink
flink接入spring体系
flink由于是job-manager加task-manager的结构,接入spring时需要有一些注意事项,本文列举一下关键点
Volunteer Technology
1 天前
大数据
·
flink
Flink编程模型与API
Flink的异步I/O是一个非常受欢迎的特性,由阿里巴巴贡献给社区,并在1.2版本中引入,它的主要目的是解决与外部系统交互时网络延迟成为系统瓶颈的问题,外部系统往往是外部数据库。
暴躁小师兄数据学院
2 天前
大数据
·
hadoop
·
笔记
·
flink
·
spark
·
database
【AI大数据工程师特训笔记】第16讲:大数据环境安装
目录第一章:WSL与Java环境安装第二章:Hadoop安装与配置第三章:Hive安装与配置第四章:Spark安装与配置
阿里云大数据AI技术
2 天前
人工智能
·
flink
Skill即服务:用Agent安全玩转云上Flink
演讲者:李昊哲,阿里云实时计算 Flink 产品经理内容摘要Flink Skill 是阿里云为 AI Agent 时代设计的安全操作云上Flink的能力,解决了 Agent 直接调用 OpenAPI 操作生产环境时"能执行但不安全"的核心痛点。实测数据显示,Flink Skill 可将作业反压从 99% 修复至 0%,将全域巡检时间从半天缩短至 30 秒,并支持多个Skill 协同完成实时数仓搭建等复杂任务。
代码匠心
3 天前
大数据
·
数据仓库
·
flink
从零开始学Flink:Flink CDC 入门
CDC,全称 Change Data Capture(变更数据捕获),说白了就是:数据库里每发生一次增删改,我都能立刻感知到,并把它变成一条实时消息发出去。
Volunteer Technology
3 天前
大数据
·
flink
Flink的 Side Output侧输出和 ProcessFunction
在Flink处理数据流时,常常会面临这样的情况:需要对一个数据源进行处理,该数据源包含不同类型的数据,我们需要将其分割处理。使用filter算子对数据源进行筛选分割会导致数据流的多次复制,从而造成不必要的性能浪费。为了解决这个问题,Flink引入了侧输出(Side Output)机制,该机制可以将数据流进行分割,而无需对流进行复制。使用侧输出时,用户可以通过定义输出标签(Output Tag)来标识不同的侧输出流。在处理数据流时,通过适当的操作符和条件,可以将特定类型的数据发送到相应的侧输出流。
Volunteer Technology
4 天前
大数据
·
linux
·
flink
Flink的DataStream分区操作
Flink中的分区操作是将数据流根据指定的分区策略重新分配到不同节点上,由不同任务执行。默认情况下,Flink使用轮询方式(rebalance partitioner)将数据从上游分发到下游算子。然而,在某些情况下,用户可能希望自己控制分区,例如在数据倾斜的场景中,为了实现这种控制,可以使用预定义的分区策略或自定义分区策略来决定数据的流转和处理方式。
Volunteer Technology
4 天前
大数据
·
数据库
·
flink
Flink Sink
Flink Sink负责将通过Transformation转换的数据流进行输出,Flink官方提供了内置的Sink连接器,例如:FileSink Connector、JDBCSink Connector 、KafkaSink Connector等,同时也支持自定义Sink输出,简而言之,Flink的Sink模块让用户能够轻松地将计算结果输出到各种目标位置,满足不同的业务需求。
段一凡-华北理工大学
5 天前
人工智能
·
hadoop
·
学习
·
架构
·
flink
·
高炉炼铁
·
高炉炼铁智能化
工业领域的Hadoop架构学习~系列文章08:Flink流处理引擎
导言:任何不理解Flink WaterMark机制的工程师无法设计可靠的实时工业系统。本期我们将深入Flink的核心设计,从事件时间处理的水印理论出发,阐明乱序事件处理的数学保证;解析窗口计算的数学形式化;以及Exactly-Once端到端语义的实现原理。
Volunteer Technology
5 天前
大数据
·
flink
Flink的函数接口与富函数类
上一小节中学习过的Flink算子方法都有对应的接口来完成业务逻辑处理,我们可以自定义类来实现这些接口完成业务逻辑编写,然后将这些类作为参数传递给Flink算子。这些实现接口在Flink中我们通常称为函数接口,常见的Flink函数接口有:MapFunction、FlatMapFunction、ReduceFunction、FilterFunction等。
Volunteer Technology
5 天前
大数据
·
flink
Flink编程模型与API(四)
Transformation 类算子是 Apache Flink 中用于定义数据流处理的基本构建块。它们允许对DataStream数据流进行转换和操作,包括数据转换、数据操作和数据重组,通过Transformation类算子,可以对输入数据流进行映射、过滤、聚合等操作,生成新的DataStream数据流作为输出,以满足特定的处理需求。下面分别介绍Flink中常见的Transformation类算子。
大大大大晴天️
6 天前
大数据
·
flink
告别数据重复与丢失:Flink Exactly-Once 原理解析
在流处理系统中,面对网络抖动、节点宕机等异常情况,系统对消息的处理通常有三种语义:Apache Flink 通过其独特的分布式快照(Checkpoint)机制实现了引擎内部的 exactly-once 语义,并通过两阶段提交协议(2PC)将这一保障扩展到端到端(end-to-end)层面。
Volunteer Technology
6 天前
大数据
·
数据库
·
flink
Flink编程模型与API(二)
DataSources模块定义了DataStream API 中数据输入操作,Flink中内置了很多数据源Source,例如:文件数据源、Socket数据源、集合数据源,同时也支持第三方数据源,例如:Kafka数据源、自定义数据源,下面分别使用DataStream API进行一一演示。
大大大大晴天
6 天前
flink
告别数据重复与丢失:Flink Exactly-Once 原理解析
在流处理系统中,面对网络抖动、节点宕机等异常情况,系统对消息的处理通常有三种语义:Apache Flink 通过其独特的分布式快照(Checkpoint)机制实现了引擎内部的 exactly-once 语义,并通过两阶段提交协议(2PC)将这一保障扩展到端到端(end-to-end)层面。
白露与泡影
6 天前
大数据
·
flink
告别OOM焦虑:Flink 内存模型原理与诊断调优
在 Flink 生产环境中,我们基本上都会遇到以下内存问题:只有深入理解Flink内存模型,才能做到精准配置、高效调优、从容排障。
阿里云大数据AI技术
6 天前
人工智能
·
flink
优路教育借助阿里云Flink+StarRocks+Paimon湖仓一体化构建职业教育业务全链路实时数据服务平台
导读:优路教育作为国内知名的成人职业教育培训机构,业务覆盖建工、消防、医卫、财经、教师、法考等多个领域,服务百万学员。随着业务规模的持续扩大,数据驱动的精细化运营成为核心竞争力。优路教育大数据团队携手阿里云,基于实时计算 Flink + EMR Serverless StarRocks + DLF(Paimon) 构建了全链路实时数据服务平台,从学员画像、营销筛选到题库关联查询,实现了从“分钟级延迟”到“秒级响应”的质变,为成人教育行业的数据化转型提供了标杆实践。
愤怒的苹果ext
6 天前
elasticsearch
·
flink
·
时间
Flink同步到ES时间遇到的问题
解决方案:项目中jackson配置会把UTC时间转换,所以在存入时间就-8小时转成UTC时间就没毛病。
阿坤带你走近大数据
7 天前
flink
·
数据湖
·
paimon
Paimon相关概念的介绍
Apache Paimon(原名 Flink Table Store)是专为 流批一体 设计的下一代数据湖存储格式。它不仅仅是一个文件格式,更是一个完整的 Streaming Data Lake Platform。