AWS中的离线计算(大数据大屏项目)

一图胜千言

这里主要是通过Glue ETL Job将普通业务库(MySQL)里面的表数据,每日定时任务写入前天的数据到s3(保存为Hadoop的格式为parquet),然后,使用爬虫Crawler定时从S3桶中爬数据,爬到Glue的数据库和表中,即Glue Data Catalog,然后,使用Athena进行查业务聚合查询,结果保存到s3桶中,并使用QuickSight呈现为大屏。这就是AWS最简单的大数据离线计算大屏项目了。

参考

相关推荐
面向Google编程5 小时前
Flink源码阅读:Watermark机制
大数据·flink
Hello.Reader6 小时前
Flink SQL DELETE 语句批模式行级删除、连接器能力要求与实战避坑(含 Java 示例)
java·sql·flink
Elastic 中国社区官方博客8 小时前
让我们把这个 expense 工具从 n8n 迁移到 Elastic One Workflow
大数据·运维·elasticsearch·搜索引擎·ai·信息可视化·全文检索
邮一朵向日葵11 小时前
企查查开放平台MCP:为AI智能体注入精准商业数据,驱动智能决策新时代
大数据·人工智能
Java&Develop11 小时前
DataEase图表页面传参至数据库查询方法 和页面筛选方法 sql传参
数据库·sql
沃达德软件11 小时前
智能警务视频侦查系统
大数据·人工智能·数据挖掘·数据分析·实时音视频·视频编解码
湘-枫叶情缘12 小时前
“智律提效”AI数字化运营落地项目可行性方案
大数据·人工智能·产品运营
Blossom.11813 小时前
大模型推理优化实战:连续批处理与PagedAttention性能提升300%
大数据·人工智能·python·神经网络·算法·机器学习·php
F36_9_13 小时前
数字化项目管理系统分享:7款助力企业实现项目智能化协同的工具精选
大数据
qq_124987075313 小时前
基于协同过滤算法的在线教育资源推荐平台的设计与实现(源码+论文+部署+安装)
java·大数据·人工智能·spring boot·spring·毕业设计