flink

java叶新东老师1 天前
linux·运维·flink
docker in docker - 在docker容器中使用宿主机的docker优点是:你既可以将你的具体需求容器化部署,又不用直接在宿主机上安装,而是可以直接在容器中操作宿主机的docker来实现。 至于缺点嘛,博主目前还没找到;
LiRuiJie2 天前
大数据·hadoop·flink·iceberg·flinkcdc
基于Hadoop3.3.4+Flink1.17.0+FlinkCDC3.0.0+Iceberg1.5.0整合,实现数仓实时同步mysql数据验证:添加如下内容:验证:在两台机器都执行:添加:执行使其生效:假设 Hadoop 安装目录是 /opt/hadoop,配置文件在 $HADOOP_HOME/etc/hadoop/ 下。
java叶新东老师3 天前
linux·运维·flink
git stash 命令详解当正在dev分支上开发某个项目,这时项目中出现一个bug,需要紧急修复,但是正在开发的内容只是完成一半,还不想提交,这时可以用git stash命令将修改的内容保存至堆栈区,然后顺利切换到hotfix分支进行bug修复,修复完成后,再次切回到dev分支,从堆栈中恢复刚刚保存的内容。
java叶新东老师3 天前
linux·运维·flink
linux 部署 flink 1.15.1 并提交作业https://flink.apache.org/downloads.html#apache-flink-1151
花下的晚风3 天前
大数据·flink
模拟flink处理无限数据流如果没有在 linux 环境下安装 flink ,先看我的上一篇文章:如何搭建Linux环境下的flink本地集群-CSDN博客
小悟空3 天前
大数据·面试·flink
[AI 生成] Flink 面试题Flink 面试题通常覆盖核心概念、API、状态管理、容错机制、性能调优及实际应用场景。这里整理一份常见且重要的 Flink 面试题,涵盖不同难度级别:
livemetee3 天前
大数据·学习·flink
Flink2.0学习笔记:Stream API 常用转换算子EC0720/FLINKTASK-TEST-STREAM/demo at master · stevensu1/EC0720
阿里云大数据AI技术3 天前
大数据·人工智能·flink
[VLDB 2025]面向Flink集群巡检的交叉对比学习异常检测近日,由阿里云计算平台大数据基础工程技术团队主导,华东师范大学数据科学与工程学院合作的论文《Noise Matters: Cross Contrastive Learning for Flink Anomaly Detection》被数据库领域顶会VLDB 2025接收。论文从新的视角分析Flink平台的热点机器问题。实现了基于神经网络的热点机器异常检测,与SOTA异常检测算法相比平均提升F1 score 12.1%。
lucky_syq3 天前
大数据·flink
Flink窗口:解锁流计算的秘密武器在大数据的世界里,数据源源不断地产生,形成了所谓的 “无限数据流”。想象一下,网络流量监控中,每一秒都有海量的数据包在网络中穿梭,这些数据构成了一个无始无终的流。对于这样的无限数据流,直接处理往往是不现实的,就好比让你一口气喝完大海里的水,这显然是不可能的。
明天好,会的3 天前
flink·spark·wasm
从Spark/Flink到WASM:流式处理框架的演进与未来展望在流处理技术的演进道路上,我们正站在一个关键的十字路口。传统框架如Flink和Spark Streaming虽然构建了坚不可摧的"技术堡垒",但这座堡垒的维护成本正变得越来越沉重——每次部署都像是在指挥一支交响乐团,需要精确协调JVM参数、集群资源和检查点配置。 与此同时,WASM等新兴技术如同轻骑兵般快速突进,它们用.wasm文件替代了沉重的部署包,用毫秒级冷启动颠覆了传统的资源调度模式。本文将带您深入这个技术演进的战场,剖析传统框架的"技术债务"如何成为创新的绊脚石,以及WASM等新技术如何在性能与便
花下的晚风5 天前
linux·flink
如何搭建Linux环境下的flink本地集群这里我使用的是 WSL2安装前,先用管理员打开终端,执行以下三条命令,目的是开启安装 WSL2所需要的环境
lifallen5 天前
java·大数据·数据结构·数据库·算法·flink·哈希算法
Flink堆状态后端核心:CopyOnWriteStateMap解析CopyOnWriteStateMap<K, N, S> 是 Flink 堆状态后端中 StateMap 的一个核心实现,它通过写时复制 (Copy-on-Write, COW) 机制来支持高效的异步快照和增量式哈希重组 (incremental rehashing)。它在性能和内存效率之间做了一些权衡,以换取这些高级特性。
expect7g6 天前
后端·flink
Flink-反压-4.源码分析-浮动缓冲区和专属缓冲区在前面文章Flink-反压-2.源码分析-流程-1,我们知道BufferManager主要回收的是专属缓冲区,浮动缓冲区的递归回收,其实还是要看LocalBufferPool的逻辑
expect7g7 天前
后端·flink
Flink-反压-3.源码分析-流程-2整个反压机制不是单单一个算子去实现的,而是上下游协同操作的,因此,解析源码的时候会拆出每个单独的部分,没办法全面去协调解析,很绕,分为以下几步
expect7g7 天前
后端·flink
Flink-反压-2.源码分析-流程-1整个反压机制不是单单一个算子去实现的,而是上下游协同操作的,因此,解析源码的时候会拆出每个单独的部分,没办法全面去协调解析,很绕,分为以下几步
Flink_China8 天前
大数据·flink
抖音集团基于Flink的亿级RPS实时计算优化实践**摘要:**本文整理自抖音集团数据工程师陶王飞和羊艺超老师,在 Flink Forward Asia 2024 生产实践(一)专场中的分享。主要内容主要分为以下四个部分:
csgo打的菜又爱玩9 天前
java·大数据·flink
17.TaskExecutor与ResourceManager交互先看一下 startRegistrationTimeout方法的实现:再看一下 tryConnectToResourceManager方法
lifallen9 天前
java·大数据·数据库·flink
Paimon INSERT OVERWRITE在 Paimon 中,INSERT OVERWRITE 是一种原子性的数据替换操作。它不像传统数据库的 DELETE + INSERT,而是一个完整的、不可分割的事务。
智海观潮11 天前
大数据·flink·flink cdc·实时数据同步
如何解决Flink CDC同步时间类型字段8小时时间差的问题,以MySQL为例在使用Flink CDC进行数据同步时,默认情况下经常会遇到时间类型的字段与实际值相差8个小时的问题。本文以MySQL为例提供解决方案,其他数据源也可以参考这类实现。
小白上线*^_^*11 天前
大数据·flink
Flink实时流量统计:基于窗口函数与Redis Sink的每小时PV监控系统(学习记录)题目:利用flink统计网站浏览量,并写入redis。利用窗口函数以及算子实现每小时PV(网站的页面浏览量)统计,对统计后结果数据格式进行设计,存储至Redis中(利用sink将处理后结果数据输出到redis数据库中)。