import argparse
import logging
import sys
from pyflink.common import WatermarkStrategy, Encoder, Types
from pyflink.datastream import StreamExecutionEnvironment, RuntimeExecutionMode
from pyflink.datastream.connectors.file_system import FileSource, StreamFormat, FileSink, OutputFileConfig, RollingPolicy
env = StreamExecutionEnvironment.get_execution_environment()
env.set_runtime_mode(RuntimeExecutionMode.BATCH)
# write all the data to one file
env.set_parallelism(1)
ds = env.from_source(
source=FileSource.for_record_stream_format(StreamFormat.text_line_format(),
'./test.csv')
.process_static_file_set().build(),
watermark_strategy=WatermarkStrategy.for_monotonous_timestamps(),
source_name="aaaa"
)
ds.print()
env.execute()
pyflink 读取excel
scan7242024-05-01 13:07
相关推荐
Ulyanov10 分钟前
打造现代化雷达电子对抗仿真界面 第一篇:tkinter/ttk 现代化高级技巧与复杂布局系统设计wgzrmlrm7437 分钟前
SQL实现按用户偏好进行分组汇总_自定义聚合规则7年前端辞职转AI43 分钟前
Python 变量7年前端辞职转AI44 分钟前
Python 数据类型冰块的旅行1 小时前
python环境导出曲幽1 小时前
我用fastapi-scaff搭了个项目,两天工期缩到两小时,老板以为我开挂了半点闲1 小时前
入门 SQLAlchemy 教程:从 0 到 1 创建数据库好家伙VCC1 小时前
# 发散创新:基于事件驱动架构的实时日志监控系统设计与实现在现代分布式系统中,**事件驱动编程模型**正测试19981 小时前
postman接口测试详解SuniaWang1 小时前
Java 17实战:Record与密封类的黄金搭档