AWS中的离线计算(大数据大屏项目)

一图胜千言

这里主要是通过Glue ETL Job将普通业务库(MySQL)里面的表数据,每日定时任务写入前天的数据到s3(保存为Hadoop的格式为parquet),然后,使用爬虫Crawler定时从S3桶中爬数据,爬到Glue的数据库和表中,即Glue Data Catalog,然后,使用Athena进行查业务聚合查询,结果保存到s3桶中,并使用QuickSight呈现为大屏。这就是AWS最简单的大数据离线计算大屏项目了。

参考

相关推荐
字节跳动数据平台19 分钟前
得物×火山引擎:Data Agent驱动财务管理智能升级
大数据
想ai抽20 分钟前
Spark的shuffle类型与对比
大数据·数据仓库·spark
智海观潮1 小时前
JVM垃圾回收器、内存分配与回收策略
java·大数据·jvm
随心............1 小时前
sqoop采集完成后导致hdfs数据与Oracle数据量不符的问题。怎么解决?
hive·hadoop·sqoop
TG_yunshuguoji1 小时前
亚马逊云代理:利用亚马逊云进行大规模数据分析与处理的最佳实践
服务器·数据挖掘·数据分析·云计算·aws
B站_计算机毕业设计之家1 小时前
机器学习:基于大数据的基金数据分析可视化系统 股票数据 金融数据 股价 Django框架 大数据技术(源码) ✅
大数据·python·金融·数据分析·股票·etf·基金
墨香幽梦客2 小时前
塑胶制造生产ERP:有哪些系统值得关注
大数据·人工智能·制造
cliproxydaili2 小时前
IP 汇总名单
大数据·网络
在未来等你3 小时前
Elasticsearch面试精讲 Day 28:版本升级与滚动重启
大数据·分布式·elasticsearch·搜索引擎·面试
呼哧呼哧.11 小时前
Spring的核心思想与注解
数据库·sql·spring