AWS中的离线计算(大数据大屏项目)

一图胜千言

这里主要是通过Glue ETL Job将普通业务库(MySQL)里面的表数据,每日定时任务写入前天的数据到s3(保存为Hadoop的格式为parquet),然后,使用爬虫Crawler定时从S3桶中爬数据,爬到Glue的数据库和表中,即Glue Data Catalog,然后,使用Athena进行查业务聚合查询,结果保存到s3桶中,并使用QuickSight呈现为大屏。这就是AWS最简单的大数据离线计算大屏项目了。

参考

相关推荐
yiyeguzhou100几秒前
论文解读:CortenMM- Efficient Memory Management with Strong Correctness Guarantees
性能优化·云计算
睡前要喝豆奶粉1 分钟前
EF Core动态sql
数据库·sql·c#·.netcore
AWS官方合作商6 分钟前
AWS GPU实例深度解析:G系列与P系列如何选择?
云计算·aws
z***02607 分钟前
Python大数据可视化:基于大数据技术的共享单车数据分析与辅助管理系统_flask+hadoop+spider
大数据·python·信息可视化
知识分享小能手9 分钟前
openEuler入门学习教程,从入门到精通,openEuler 24.03 环境下 Hadoop 全面实践指南(19)
大数据·hadoop·openeuler
3***g2059 分钟前
SQL sever数据导入导出实验
数据库·sql·oracle
艾莉丝努力练剑13 分钟前
时光织网:基于Rokid AI眼镜的家庭智能协同中枢设计与实现
大数据·人工智能·kotlin·rokid
u***284718 分钟前
如何在docker中的mysql容器内执行命令与执行SQL文件
sql·mysql·docker
合作小小程序员小小店24 分钟前
桌面开发,物业管理系统开发,基于C#,winform,mysql数据库
开发语言·数据库·sql·mysql·microsoft·c#
F***E23938 分钟前
SQL 注入详解:原理、危害与防范措施
数据库·sql·oracle