AWS中的离线计算(大数据大屏项目)

一图胜千言

这里主要是通过Glue ETL Job将普通业务库(MySQL)里面的表数据,每日定时任务写入前天的数据到s3(保存为Hadoop的格式为parquet),然后,使用爬虫Crawler定时从S3桶中爬数据,爬到Glue的数据库和表中,即Glue Data Catalog,然后,使用Athena进行查业务聚合查询,结果保存到s3桶中,并使用QuickSight呈现为大屏。这就是AWS最简单的大数据离线计算大屏项目了。

参考

相关推荐
thubier(段新建)15 小时前
OWTB 3PL 核心主流程与行业落地方案
大数据·人工智能
YangYang9YangYan15 小时前
2026大数据专业毕业学数据分析的价值
大数据·数据挖掘·数据分析
跨境生态圈15 小时前
2026外贸获客渠道全面洗牌:AI正在重新分配全球流量,你的品牌在答案里吗?
大数据·运维·人工智能·chatgpt
YangYang9YangYan15 小时前
2026大数据专业填报志愿学数据分析的价值
大数据·数据挖掘·数据分析
TTBIGDATA15 小时前
【Ambari Plus】11.Kafka 安装
大数据·hadoop·分布式·kafka·ambari·hdp·ambari plus
星空15 小时前
git指令
大数据·elasticsearch·搜索引擎
李昊哲小课15 小时前
Ubuntu26.04 搭建 Hadoop3.5.0 完全分布式
大数据·hadoop·分布式·ubuntu·hdfs·mapreduce
AOwhisky15 小时前
kubernetes(K8s)学习笔记:第八期与第九期核心知识点自测与详解
笔记·云原生·kubernetes·云计算·k8s·集群·网络策略
吴声子夜歌15 小时前
SQL进阶——EXISTS谓词
java·数据库·sql
2601_9549711316 小时前
人工智能与大数据专业填报指南:核心区别、职业路径
大数据·人工智能