flink和机器学习模型的常用组合方式

背景

flink是一个低延迟高吞吐的系统,每秒处理的数据量高达数百万,而机器模型一般比较笨重,虽然功能强大,但是qps一般都比较低,日常工作中,我们一般是如何把flink和机器学习模型组合起来一起使用呢?

flink和机器学习模型的常用组合方式

第一种:flink处理和机器模型的处理完全分离

一般来说,这是目前常用的组合方式,首先利用flink集群先把数据处理完,然后输出一份结果数据到某个外部存储,比如DB中,到这里flink的处理就完成了。紧接着是会有一个外部的定时任务,其任务是获取flink的结果数据,然后调用机器模型接口获取最终的预测结果,把这份预测结果写入到最终的存储目的地

第二种: flink处理和机器模型处理完全结合

这种方式要解决的最大问题是flink的处理速度和机器模型的qps完全不是一个数量级的问题,所以为了将就机器模型的吞吐量,我们一般会在flink中进行数据聚合操作,比如把每分钟的数据聚合然后在调用一次机器模型,这样就相当于每分钟只会调用一次机器模型接口,这种访问量机器模型完全能应对

相关推荐
2501_9110676641 分钟前
探秘叁仟智盒设备:智慧城市的智能枢纽
大数据·人工智能·智慧城市
黄雪超2 小时前
核心知识—— RDD常用算子之数据转换
大数据·spark
AWS官方合作商2 小时前
AWS云服务:大数据公司实现技术突破与商业价值的核心引擎
大数据·云计算·aws
码界筑梦坊6 小时前
基于Spark的抖音数据分析热度预测系统
大数据·信息可视化·数据分析·spark·毕业设计·个性化推荐
生信学习小达人7 小时前
arcgis10.8 Toolbox中没有找到conversion tools模块
大数据
Oo_Amy_oO8 小时前
Airflow+Spark/Flink vs. Kettle
大数据·flink·spark
后端小肥肠9 小时前
港大团队开源LightRAG:知识图谱+双层检索,复杂问答准确率飙升30%
大数据·人工智能·openai
计算机毕设定制辅导-无忧学长20 小时前
TDengine 权限管理与安全配置实战(二)
大数据·安全·tdengine
2401_8979300620 小时前
Kibana 连接 Elasticsearch(8.11.3)教程
大数据·elasticsearch·jenkins
计算机毕设定制辅导-无忧学长20 小时前
TDengine 快速上手:安装部署与基础 SQL 实践(一)
大数据·sql·tdengine