AWS中的离线计算（大数据大屏项目）

亚林瓜子2025-09-29 11:24

一图胜千言

这里主要是通过Glue ETL Job将普通业务库（MySQL）里面的表数据，每日定时任务写入前天的数据到s3（保存为Hadoop的格式为parquet），然后，使用爬虫Crawler定时从S3桶中爬数据，爬到Glue的数据库和表中，即Glue Data Catalog，然后，使用Athena进行查业务聚合查询，结果保存到s3桶中，并使用QuickSight呈现为大屏。这就是AWS最简单的大数据离线计算大屏项目了。

参考

Data Analysis Made Easy: S3, AWS Glue, Athena and Quicksight.

上一篇：NLP：关于Bert模型的基础讲解

下一篇：Jenkins：持续集成和持续交付（CI/CD）工具

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 102026 年 AI 大模型 & AI 编程工具实战全总结