Flink转换算子——filter

filter转换操作,顾名思义是对数据流执行一个过滤,通过一个布尔条件表达式设置过滤条件,对于每一个流内元素进行判断,若为true则元素正常输出,若为false则元素被过滤掉。

进行filter转换之后的新数据流的数据类型与原数据流是相同的。filter转换需要传入的参数需要实现FilterFunction接口,而FilterFunction内要实现filter()方法,就相当于一个返回布尔类型的条件表达式。

****案例需求:****下面的代码会将数据流中传感器id为sensor_1的数据过滤出来。

java 复制代码
import com.atguigu.bean.WaterSensor;
import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;

public class Flatapdeam {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);
        DataStreamSource<WaterSensor> senseDS = env.fromElements(new WaterSensor("s1", 1l, 1)
                , new WaterSensor("s1", 2l, 2),
                new WaterSensor("s2", 3l, 3)
        );

        SingleOutputStreamOperator<String> flatMap = senseDS.flatMap(new FlatMapFunction<WaterSensor, String>() {
            @Override
            public void flatMap(WaterSensor waterSensor, Collector<String> collector) throws Exception {
                if ("s1".equals(waterSensor.getId())) {
                    collector.collect(waterSensor.getVc() + "");
                } else if ("s2".equals(waterSensor.getId())) {
                    collector.collect(waterSensor.getTs().toString());
                    collector.collect(waterSensor.getVc().toString());

                }
            }


        });
            flatMap.print();

        env.execute();
    }
}

可以看出我们代码的前几个步骤是相同的是首先获取执行环境,创建源算子,不同的是使用不同的转换算子,我们这篇文章主要是介绍filter算子也就是过滤算子,通过一个布尔条件表达式设置过滤条件,对于每一个流内元素进行判断,若为true则元素正常输出,若为false则元素被过滤掉

详细来看,我们是对数据进行了一个筛选:

java 复制代码
 SingleOutputStreamOperator<String> flatMap = senseDS.flatMap(new FlatMapFunction<WaterSensor, String>() {
            @Override
            public void flatMap(WaterSensor waterSensor, Collector<String> collector) throws Exception {
                if ("s1".equals(waterSensor.getId())) {
                    collector.collect(waterSensor.getVc() + "");
                } else if ("s2".equals(waterSensor.getId())) {
                    collector.collect(waterSensor.getTs().toString());
                    collector.collect(waterSensor.getVc().toString());

                }
            }


        });

实现FilterFunction接口,而FilterFunction内要实现filter()方法,就相当于一个返回布尔类型的条件表达式。

对进来的数据获取其Id 通过与给定的标准进行对比,进行过滤

相关推荐
yaoxin5211237 小时前
390. Java IO API - WatchDir 示例
java·前端·python
samFuB8 小时前
【实证分析】省级农产品出口技术复杂度数据-含代码(2004-2024年)
大数据
samFuB8 小时前
【数据集】中国31个省农村用电量-含dta及xlsx(1978-2024年)
大数据
成长之路5148 小时前
【数据集】上市公司企业组织惯性数据(2012-2024年)
大数据
Halo_tjn9 小时前
Java 基于字符串相关知识点
java·开发语言·算法
梦想的颜色9 小时前
java 利用redis来限制用户频繁点击
java·开发语言
PH = 710 小时前
OverlayFS联合文件系统使用示例
java·linux·服务器
AC赳赳老秦10 小时前
OpenClaw进阶技巧:批量修改文件内容、替换关键词,解放双手
java·linux·人工智能·python·算法·测试用例·openclaw
Java小白笔记11 小时前
OpenClaw 实战方法论
java·开发语言·人工智能·ai·全文检索·ai编程·ai写作
Tigerbot11 小时前
虎博科技CEO卢鑫:GEO方法论提出者,AI Marketing 与 AI GEO专家
大数据·人工智能·科技