import argparse
import logging
import sys
from pyflink.common import WatermarkStrategy, Encoder, Types
from pyflink.datastream import StreamExecutionEnvironment, RuntimeExecutionMode
from pyflink.datastream.connectors.file_system import FileSource, StreamFormat, FileSink, OutputFileConfig, RollingPolicy
env = StreamExecutionEnvironment.get_execution_environment()
env.set_runtime_mode(RuntimeExecutionMode.BATCH)
# write all the data to one file
env.set_parallelism(1)
ds = env.from_source(
source=FileSource.for_record_stream_format(StreamFormat.text_line_format(),
'./test.csv')
.process_static_file_set().build(),
watermark_strategy=WatermarkStrategy.for_monotonous_timestamps(),
source_name="aaaa"
)
ds.print()
env.execute()
pyflink 读取excel
scan7242024-05-01 13:07
相关推荐
春日见6 分钟前
5分钟入门强化学习之动态规划算法与实现DeniuHe37 分钟前
sklearn 中所有交叉验证数据集划分方式完整总结DeniuHe41 分钟前
sklearn中不同交叉验证方法的场景适配隐于花海,等待花开1 小时前
16.Python 常用第三方库概览 深度解析我材不敲代码1 小时前
Python 函数核心:位置参数与关键字参数详解风落无尘1 小时前
第十一章《对齐与安全》 完整学习资料Kratzdisteln1 小时前
【无标题】hakesashou2 小时前
python文件操作需要导入模块吗wuxinyan1232 小时前
工业级大模型学习之路029:解决双智能体调用数据库报错问题SunnyDays10112 小时前
Python操作Excel批注:从基础添加到高级自定义的完整指南