AWS中的离线计算(大数据大屏项目)

一图胜千言

这里主要是通过Glue ETL Job将普通业务库(MySQL)里面的表数据,每日定时任务写入前天的数据到s3(保存为Hadoop的格式为parquet),然后,使用爬虫Crawler定时从S3桶中爬数据,爬到Glue的数据库和表中,即Glue Data Catalog,然后,使用Athena进行查业务聚合查询,结果保存到s3桶中,并使用QuickSight呈现为大屏。这就是AWS最简单的大数据离线计算大屏项目了。

参考

相关推荐
俊哥大数据5 小时前
【项目10】基于Flink房地产领域大数据实时分析系统
大数据·flink
sensen_kiss5 小时前
INT303 Big Data Analysis 大数据分析 Pt.12 推荐系统(Recommendation Systems)
大数据·数据挖掘·数据分析
数字化转型20256 小时前
企业数字化架构集成能力建设
大数据·程序人生·机器学习
jayaccc6 小时前
Git命令大全:从入门到精通
大数据·git·elasticsearch
Hello.Reader6 小时前
Flink CEP Pattern API、连续性、跳过策略、超时与迟到数据一篇讲透
大数据·flink
Knight_AL7 小时前
Spring 事务传播行为 + 事务失效原因 + 传播行为为什么不用其他模式
数据库·sql·spring
ZStack开发者社区7 小时前
替代VMware | ZStack Cloud精细化运营解析:租户管控+计费透明
云计算
极海拾贝7 小时前
GeoScene解决方案中心正式上线!
大数据·人工智能·深度学习·arcgis·信息可视化·语言模型·解决方案
qq_2624960910 小时前
Elasticsearch 核心参数调优指南
大数据·elasticsearch
OpenCSG10 小时前
AgenticOps 如何重构企业 AI 的全生命周期管理体系
大数据·人工智能·深度学习