【Flink学习】（三）Flink 数据源详解，主流 Source 数据读取

清平乐的技术专栏2026-05-21 8:25

内置数据源、文件数据源、网络数据源、Kafka 主流数据源、自定义数据源

java 复制代码

List<String> dataList = Arrays.asList("java","flink","spark");
DataStreamSource<String> listStream = env.fromCollection(dataList);

java 复制代码

DataStreamSource<String> elementStream = env.fromElements("张三","李四","王五");

java 复制代码

DataStreamSource<String> socketStream = env.socketTextStream("localhost", 8888);

1、读取本地单行文本文件

2、读取 HDFS 分布式文件

3、区分有界流（文件）、无界流（实时数据流）

Flink 对接 Kafka 消费实时数据，配置消费者组、主题、序列化方式，实现实时读取消息队列数据

本地测试：集合、元素、Socket 数据源

离线分析：本地文件、HDFS 文件

线上实时业务：统一使用 Kafka 数据源