flink和机器学习模型的常用组合方式

背景

flink是一个低延迟高吞吐的系统,每秒处理的数据量高达数百万,而机器模型一般比较笨重,虽然功能强大,但是qps一般都比较低,日常工作中,我们一般是如何把flink和机器学习模型组合起来一起使用呢?

flink和机器学习模型的常用组合方式

第一种:flink处理和机器模型的处理完全分离

一般来说,这是目前常用的组合方式,首先利用flink集群先把数据处理完,然后输出一份结果数据到某个外部存储,比如DB中,到这里flink的处理就完成了。紧接着是会有一个外部的定时任务,其任务是获取flink的结果数据,然后调用机器模型接口获取最终的预测结果,把这份预测结果写入到最终的存储目的地

第二种: flink处理和机器模型处理完全结合

这种方式要解决的最大问题是flink的处理速度和机器模型的qps完全不是一个数量级的问题,所以为了将就机器模型的吞吐量,我们一般会在flink中进行数据聚合操作,比如把每分钟的数据聚合然后在调用一次机器模型,这样就相当于每分钟只会调用一次机器模型接口,这种访问量机器模型完全能应对

相关推荐
Jackyzhe32 分钟前
Flink学习笔记:多流 Join
笔记·学习·flink
Guheyunyi2 小时前
智慧停车管理系统:以科技重塑交通效率与体验
大数据·服务器·人工智能·科技·安全·生活
Jackeyzhe9 小时前
Flink学习笔记:时间与Watermark
flink
wang_yb11 小时前
数据会说谎?三大推断方法帮你“审问”数据真相
大数据·databook
天远数科13 小时前
Golang并发实战:高效对接天远API实现海量用户画像构建
大数据·api
expect7g13 小时前
Paimon源码解读 -- Compaction-2.KeyValueFileWriterFactory
大数据·后端·flink
第二只羽毛13 小时前
C++ 高性能编程要点
大数据·开发语言·c++·算法
jason成都14 小时前
elasticsearch部署时创建用户密码
大数据·elasticsearch·jenkins
新华经济15 小时前
合同管理系统2025深度测评:甄零科技居榜首
大数据·人工智能·科技
黑客思维者15 小时前
招商银行信用卡AI客服系统:从0到1实战笔记
大数据·人工智能·笔记