【Flink学习】(三)Flink 数据源详解,主流 Source 数据读取

内置数据源、文件数据源、网络数据源、Kafka 主流数据源、自定义数据源

二、内置数据源

1、集合数据源:本地测试推荐此类

java 复制代码
List<String> dataList = Arrays.asList("java","flink","spark");
DataStreamSource<String> listStream = env.fromCollection(dataList);

2、元素直接创建数据源

java 复制代码
DataStreamSource<String> elementStream = env.fromElements("张三","李四","王五");

3、Socket 网络数据源:实时流式测试常用

java 复制代码
DataStreamSource<String> socketStream = env.socketTextStream("localhost", 8888);

三、文件数据源

1、读取本地单行文本文件

2、读取 HDFS 分布式文件

3、区分有界流(文件)、无界流(实时数据流)

四、Kafka 数据源(重点-企业核心)

Flink 对接 Kafka 消费实时数据,配置消费者组、主题、序列化方式,实现实时读取消息队列数据

五、数据源使用场景选择

本地测试:集合、元素、Socket 数据源

离线分析:本地文件、HDFS 文件

线上实时业务:统一使用 Kafka 数据源

相关推荐
SelectDB16 小时前
Apache Doris Python UDF:让 SQL 直接调用 Python 生态,支撑 Agent 时代复杂业务逻辑
大数据·数据库·python
ApacheSeaTunnel19 小时前
当多表数据涌入,Apache SeaTunnel 如何巧妙化解主键冲突?
大数据·开源·数据集成·seatunnel·技术分享·数据同步
大大大大晴天2 天前
Flinksql内置函数不够用?一文弄懂UDF
flink
大大大大晴天4 天前
Hudi Metadata Table 与 Hive Sync (HMS)怎么选?
大数据
手可摘星辰7774 天前
一次线上FlinkCDC异常排查复盘
大数据·flink
大大大大晴天4 天前
Hudi技术内幕:Metadata Table原理与实践
大数据
大大大大晴天5 天前
Hudi技术内幕:深入解析Index索引机制
大数据
阿里云大数据AI技术5 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据·flink
SelectDB6 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
tonyabasy7 天前
Flink 实时数仓开发实战:SQL中也能做到资源精细化管理
flink