【Flink学习】(三)Flink 数据源详解,主流 Source 数据读取

内置数据源、文件数据源、网络数据源、Kafka 主流数据源、自定义数据源

二、内置数据源

1、集合数据源:本地测试推荐此类

java 复制代码
List<String> dataList = Arrays.asList("java","flink","spark");
DataStreamSource<String> listStream = env.fromCollection(dataList);

2、元素直接创建数据源

java 复制代码
DataStreamSource<String> elementStream = env.fromElements("张三","李四","王五");

3、Socket 网络数据源:实时流式测试常用

java 复制代码
DataStreamSource<String> socketStream = env.socketTextStream("localhost", 8888);

三、文件数据源

1、读取本地单行文本文件

2、读取 HDFS 分布式文件

3、区分有界流(文件)、无界流(实时数据流)

四、Kafka 数据源(重点-企业核心)

Flink 对接 Kafka 消费实时数据,配置消费者组、主题、序列化方式,实现实时读取消息队列数据

五、数据源使用场景选择

本地测试:集合、元素、Socket 数据源

离线分析:本地文件、HDFS 文件

线上实时业务:统一使用 Kafka 数据源

相关推荐
数智前线4 小时前
腾讯云融合创新产品矩阵全面升级,首次发布专有云版“龙虾”
大数据·人工智能
Luminbox紫创测控4 小时前
基于环境舱的新能源汽车三高试验方法与热响应评估
大数据·人工智能·测试工具·汽车·安全性测试·测试标准
敲上瘾4 小时前
LangChain 消息机制与提示词模板指南
大数据·python·langchain
枫叶林FYL4 小时前
【机器学习与智慧医疗】糖尿病视网膜病变视力丧失预测:贝叶斯估计与威布尔分布
大数据·人工智能·机器学习
十六年开源服务商4 小时前
2026网站建设方案内容审批避坑指南
大数据·人工智能
团象科技4 小时前
跨境业务频繁卡顿遇瓶颈?谷歌云AI算力补齐链路短板破局增收
大数据·人工智能·深度学习
Bechamz4 小时前
大数据开发学习Day37
大数据·学习
浪子sunny5 小时前
2026股票实时行情数据Skills技能分享
大数据·人工智能·python
云朵观自在5 小时前
企业媒体宣发为何选择JHMS?——一家策略导向的媒体传讯服务商
大数据·人工智能·经验分享·媒体·jhms