pyflink filter

import json

import re

import logging

import sys

from collections import Counter

from pyflink.datastream import DataStream, StreamExecutionEnvironment

from pyflink.datastream.functions import RuntimeContext, FlatMapFunction, MapFunction,FilterFunction

from pyflink.common.typeinfo import Types

s_env = StreamExecutionEnvironment.get_execution_environment()

data = DataStream(s_env._j_stream_execution_environment.socketTextStream('192.168.137.201', 8899))

data.print()

def get_key():

return '999'

class LogEvent:

world = None

def init(self, world):

self.world = world

self.count = count

def to_dict(self):

return {

"world": str(self.world)

"count": str(self.count)

}

class MyMapFunction(FlatMapFunction):

def open(self, runtime_context: RuntimeContext):

pass

def flat_map(self, raw_message):

raw_message = raw_message.upper()

dict1 = {}

dict1['value'] = raw_message +'!!!'

yield dict1

class myFilterFunction(FilterFunction):

def filter(self,raw_message):

if re.findall('AAA',raw_message):

return raw_message

data.filter(myFilterFunction()).print()

s_env.execute('data')

相关推荐
DanCheng-studio14 分钟前
网安毕业设计课题思路
python·毕业设计·毕设
Code_流苏20 分钟前
Python星球日记 - 第20天:数据分析入门
python·数据分析·数据可视化·数据清洗·pandas库
毕小宝32 分钟前
Python 使用 copy_from 完成批量插入postgre数据库脚本分享
python
Hesse36 分钟前
希尔排序:Python语言实现
python·算法
love530love42 分钟前
PyCharm Community社区版链接WSL虚拟环境
ide·python·pycharm
船长@Quant43 分钟前
VectorBT量化入门系列:第一章 VectorBT基础与环境搭建
python·量化策略·sklearn·ta-lib·量化回测·vectorbt
XYN611 小时前
【嵌入式面试】
笔记·python·单片机·嵌入式硬件·学习
橙色小博3 小时前
GPT:Transformer的专精产品
人工智能·python·gpt·深度学习·神经网络·transformer
MarvinP3 小时前
python基础:位置互换
开发语言·python·算法
声声codeGrandMaster3 小时前
Django项目入门二
后端·python·django