AWS中的离线计算(大数据大屏项目)

一图胜千言

这里主要是通过Glue ETL Job将普通业务库(MySQL)里面的表数据,每日定时任务写入前天的数据到s3(保存为Hadoop的格式为parquet),然后,使用爬虫Crawler定时从S3桶中爬数据,爬到Glue的数据库和表中,即Glue Data Catalog,然后,使用Athena进行查业务聚合查询,结果保存到s3桶中,并使用QuickSight呈现为大屏。这就是AWS最简单的大数据离线计算大屏项目了。

参考

相关推荐
AWS官方合作商2 小时前
AWS实战:轻松创建弹性IP,实现固定公网IP地址
tcp/ip·云计算·aws
武子康2 小时前
大数据-110 Flink 安装与部署指南 支持 Local/Standalone/YARN 的多种模式
大数据·后端·flink
zskj_qcxjqr3 小时前
数字大健康崛起:艾灸机器人重构就业生态,传统与科技如何共生?
大数据·人工智能·科技·机器人
IT研究室3 小时前
大数据毕业设计选题推荐-基于大数据的青光眼数据可视化分析系统-大数据-Spark-Hadoop-Bigdata
大数据·hadoop·信息可视化·spark·毕业设计·源码·bigdata
建群新人小猿4 小时前
客户标签自动管理:标签自动化运营,画像持久保鲜
android·java·大数据·前端·git
云资源服务商7 小时前
阿里云负载均衡SLB深度解析:从原理到实战的全栈指南
阿里云·云计算·负载均衡
不剪发的Tony老师7 小时前
SQLE:一个全方位的SQL质量管理平台
数据库·sql
TDengine (老段)7 小时前
TDengine 时序函数 IRATE 用户手册
大数据·数据库·物联网·时序数据库·iot·tdengine
TDengine (老段)7 小时前
TDengine 时序函数 CSUM 用户手册
大数据·数据库·sql·物联网·时序数据库·iot·tdengine