import argparse
import logging
import sys
from pyflink.common import WatermarkStrategy, Encoder, Types
from pyflink.datastream import StreamExecutionEnvironment, RuntimeExecutionMode
from pyflink.datastream.connectors.file_system import FileSource, StreamFormat, FileSink, OutputFileConfig, RollingPolicy
env = StreamExecutionEnvironment.get_execution_environment()
env.set_runtime_mode(RuntimeExecutionMode.BATCH)
# write all the data to one file
env.set_parallelism(1)
ds = env.from_source(
source=FileSource.for_record_stream_format(StreamFormat.text_line_format(),
'./test.csv')
.process_static_file_set().build(),
watermark_strategy=WatermarkStrategy.for_monotonous_timestamps(),
source_name="aaaa"
)
ds.print()
env.execute()
pyflink 读取excel
scan7242024-05-01 13:07
相关推荐
全栈老石23 分钟前
Python 异步生存手册:给被 JS async/await 宠坏的全栈工程师梨落秋霜31 分钟前
Python入门篇【模块/包】阔皮大师2 小时前
INote轻量文本编辑器小法师爱分享2 小时前
StickyNotes,简单便签超实用深蓝电商API2 小时前
处理字体反爬:woff字体文件解析实战开源技术2 小时前
Claude Opus 4.6 发布,100万上下文窗口,越贵越好用张3蜂2 小时前
深入理解 Python 的 frozenset:为什么要有“不可变集合”?皮卡丘不断更2 小时前
手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”爱打代码的小林2 小时前
基于 MediaPipe 实现实时面部关键点检测极客小云3 小时前
【ComfyUI API 自动化利器:comfyui_xy Python 库使用详解】