43、Flink 自定义窗口触发器代码示例

1、方法说明

1)onElement() 方法在每个元素被加入窗口时调用。

返回 TriggerResult 来决定 trigger 如何应对到达窗口的事件
CONTINUE: 什么也不做
FIRE: 触发计算
PURGE: 清空窗口内的元素
FIRE_AND_PURGE: 触发计算,计算结束后清空窗口内的元素

2)onProcessingTime() 方法在注册的 processing-time timer 触发时调用。

返回 TriggerResult 来决定 trigger 如何应对到达窗口的事件
CONTINUE: 什么也不做
FIRE: 触发计算
PURGE: 清空窗口内的元素
FIRE_AND_PURGE: 触发计算,计算结束后清空窗口内的元素

3)onEventTime() 方法在注册的 event-time timer 触发时调用。

返回 TriggerResult 来决定 trigger 如何应对到达窗口的事件
CONTINUE: 什么也不做
FIRE: 触发计算
PURGE: 清空窗口内的元素
FIRE_AND_PURGE: 触发计算,计算结束后清空窗口内的元素

4)clear() 方法处理在对应窗口被移除时所需的逻辑。

5)onMerge() 方法与有状态的 trigger 相关,该方法会在两个窗口合并时,将窗口对应 trigger 的状态合并,比如使用会话窗口时。

2、完整代码示例

bash 复制代码
import org.apache.flink.api.common.state.ValueState;
import org.apache.flink.api.common.state.ValueStateDescriptor;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.windowing.WindowFunction;
import org.apache.flink.streaming.api.windowing.assigners.GlobalWindows;
import org.apache.flink.streaming.api.windowing.triggers.Trigger;
import org.apache.flink.streaming.api.windowing.triggers.TriggerResult;
import org.apache.flink.streaming.api.windowing.windows.GlobalWindow;
import org.apache.flink.streaming.api.windowing.windows.Window;
import org.apache.flink.util.Collector;

import java.util.ArrayList;
import java.util.List;

/**
 * FIRE 会保留被触发的窗口中的内容,Flink 内置的 trigger 默认使用 `FIRE`。
 * FIRE_AND_PURGE 不会保留被触发的窗口中的内容
 * Purge 只会移除窗口中的内容,不会移除关于窗口的 meta-information 和 trigger 的状态
 */
public class _08_WindowTriggerCustom {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        DataStreamSource<String> input = env.socketTextStream("localhost", 8888);

        ArrayList<String> keyList = new ArrayList<>();
        keyList.add("c");
        keyList.add("d");

        // 测试时限制了分区数,生产中需要设置空闲数据源
        env.setParallelism(2);

        // Processing-Time
        input.keyBy(e -> String.valueOf(e.hashCode() % 2))
                .window(GlobalWindows.create())
                .trigger(new MyCustomWindowTrigger<>(keyList))
                .apply(new WindowFunction<String, String, String, GlobalWindow>() {
                    @Override
                    public void apply(String s, GlobalWindow globalWindow, Iterable<String> iterable, Collector<String> collector) throws Exception {
                        for (String word : iterable) {
                            collector.collect(word);
                        }
                    }
                })
                .print();

        env.execute();
    }
}

class MyCustomWindowTrigger<W extends Window> extends Trigger<String, W> {
    private List<String> keyWords;

    private ValueStateDescriptor<String> valueStateDescriptor;

    public MyCustomWindowTrigger(List<String> keyWords) {
        this.keyWords = keyWords;
        this.valueStateDescriptor = new ValueStateDescriptor<>("cnt", String.class);
    }

    // onElement() 方法在每个元素被加入窗口时调用。
    // 返回 `TriggerResult` 来决定 trigger 如何应对到达窗口的事件
    //- `CONTINUE`: 什么也不做
    //- `FIRE`: 触发计算
    //- `PURGE`: 清空窗口内的元素
    //- `FIRE_AND_PURGE`: 触发计算,计算结束后清空窗口内的元素
    @Override
    public TriggerResult onElement(String input, long l, W w, TriggerContext triggerContext) throws Exception {
        //当窗口内的元素匹配到首个关键字时触发,触发前的元素用 '-' 拼接
        //a0\b0\a1\b1\c2\d2
        //FIRE_AND_PURGE=会清除窗口状态
        //FIRE=不会清除窗口状态
        //2> b0
        //2> a1
        //2> c2
        //
        //1> a0
        //1> b1
        //1> d2
        ValueState<String> partitionedState = triggerContext.getPartitionedState(valueStateDescriptor);
        String value = partitionedState.value();

        for (String keyWord : keyWords) {
            if (input.startsWith(keyWord)) {
                if (value == null || value.isEmpty()) {
                    partitionedState.update(input);
                }
                value += "-" + input;
                partitionedState.update(value);
            }
        }

        if (partitionedState.value() != null && !partitionedState.value().isEmpty()) {
//            return TriggerResult.FIRE_AND_PURGE;
            return TriggerResult.FIRE;
        }

        return TriggerResult.CONTINUE;
    }

    // onProcessingTime() 方法在注册的 processing-time timer 触发时调用。
    // 返回 `TriggerResult` 来决定 trigger 如何应对到达窗口的事件
    //- `CONTINUE`: 什么也不做
    //- `FIRE`: 触发计算
    //- `PURGE`: 清空窗口内的元素
    //- `FIRE_AND_PURGE`: 触发计算,计算结束后清空窗口内的元素
    @Override
    public TriggerResult onProcessingTime(long l, W w, TriggerContext triggerContext) throws Exception {
        return TriggerResult.CONTINUE;
    }

    // onEventTime() 方法在注册的 event-time timer 触发时调用。
    // 返回 `TriggerResult` 来决定 trigger 如何应对到达窗口的事件
    //- `CONTINUE`: 什么也不做
    //- `FIRE`: 触发计算
    //- `PURGE`: 清空窗口内的元素
    //- `FIRE_AND_PURGE`: 触发计算,计算结束后清空窗口内的元素
    @Override
    public TriggerResult onEventTime(long l, W w, TriggerContext triggerContext) throws Exception {
        return TriggerResult.CONTINUE;
    }

    // clear() 方法处理在对应窗口被移除时所需的逻辑。
    @Override
    public void clear(W w, TriggerContext triggerContext) throws Exception {
        ValueState<String> partitionedState = triggerContext.getPartitionedState(valueStateDescriptor);
        partitionedState.clear();
    }

    // onMerge() 方法与有状态的 trigger 相关,该方法会在两个窗口合并时,将窗口对应 trigger 的状态合并,比如使用会话窗口时。
    @Override
    public void onMerge(W window, OnMergeContext ctx) throws Exception {
    }
}
相关推荐
段一凡-华北理工大学7 小时前
2026 高炉炼铁智能化技术全景与演进路径~系列文章11:演进路径与行业未来
大数据·网络·人工智能·算法·工业智能体·高炉炼铁智能化
狒狒热知识8 小时前
合规筑基专业赋能178软文网引领软文营销行业规范化发展
大数据
ZGi.ai9 小时前
企业AI资产管理体系:提示词、工作流、知识库应该怎么管
大数据·知识库·工作流编排·ai资产·提示词管理
爱分享的康康10 小时前
低成本自动驾驶数据采集设备理性分析:康谋入门套装适配性解析
大数据·人工智能
程序鉴定师11 小时前
上海小程序开发的坚实保障与行业优势解析
大数据·小程序
Elastic 中国社区官方博客12 小时前
我们如何在 Elasticsearch Serverless 上将向量搜索吞吐量提升一倍
大数据·数据库·人工智能·elasticsearch·搜索引擎·云原生·serverless
zgl_2005377912 小时前
源代码:跨数据库通用SQL语法解析与标注拆解
大数据·数据库·数据仓库·sql·etl·源代码管理
Ajie'Blog13 小时前
Claude 大模型深度评测:从参数架构到实战边界
大数据·人工智能·架构
暴躁小师兄数据学院14 小时前
【AI大数据工程师特训笔记】第13讲:数据库性能手术刀
大数据·数据库·数据仓库·sql·postgresql
阿里云大数据AI技术14 小时前
优路教育借助阿里云Flink+StarRocks+Paimon湖仓一体化构建职业教育业务全链路实时数据服务平台
人工智能·flink