AWS中的离线计算(大数据大屏项目)

一图胜千言

这里主要是通过Glue ETL Job将普通业务库(MySQL)里面的表数据,每日定时任务写入前天的数据到s3(保存为Hadoop的格式为parquet),然后,使用爬虫Crawler定时从S3桶中爬数据,爬到Glue的数据库和表中,即Glue Data Catalog,然后,使用Athena进行查业务聚合查询,结果保存到s3桶中,并使用QuickSight呈现为大屏。这就是AWS最简单的大数据离线计算大屏项目了。

参考

相关推荐
阿部多瑞 ABU2 分钟前
铁三角:泛二次元奶头乐经济的结构分析及其人口后果
大数据·人工智能
吴卫斌8 分钟前
波动率控制仓位系列(一):满仓轮动的“过山车”困境
大数据·python·股票·量化交易
AI焦点12 分钟前
2026年AI应用架构:如何避坑并选对API聚合中转服务?
大数据·人工智能·架构
精益数智小屋30 分钟前
项目管理看板如何拆解任务进度?项目管理看板解决跨部门协作难题
大数据·人工智能·数据分析·云计算·软件工程
xcbrand34 分钟前
湖南VI设计公司排名
大数据·人工智能·python
Jiamiren42 分钟前
2026美国至6月6日当周初请失业金人数(万人)
大数据
清辞85344 分钟前
产品经理需求推进流程
大数据·深度学习·学习·产品经理
极创信息2 小时前
Linux挖矿病毒深度清理实战教程,从进程隐藏、Rootkit驻留到彻底根除
java·大数据·linux·运维·安全·tomcat·健康医疗
SEO_juper3 小时前
Semrush 蓝海关键词筛选,AI 一键拓展完整词库
大数据·谷歌·seo·geo·gemini·询盘·b2b