AWS Redshift 集成Zero-ETL和数据共享 Data sharing

AWS Data Sharing (数据共享):Redshift 原生功能,允许跨集群、跨账户以只读方式访问数据,数据不会被物理复制,消费方直接查询提供方的存储。
Zero-ETL :AWS 托管的实时同步管道,将 Aurora、DynamoDB、RDS 等 OLTP 数据库的变更自动持续同步到 Redshift,消除手写 ETL 代码。

结合的核心优势

  1. 端到端实时分析,无管道维护
    Zero-ETL 负责将事务数据分钟级同步进 Redshift,Data Sharing 负责将这份数据即时暴露给分析团队,整个链路不需要写一行 ETL 代码或 Glue Job。
  2. 生产与分析彻底隔离
    事务数据库 → Redshift A(生产账户)→ Redshift B(分析账户)。分析团队的重查询完全打在消费集群上,不会抢占生产 compute,两侧可独立扩缩容。
  3. 数据单份存储,多方消费
    Data Sharing 的核心是"数据不动,算力动",配合 Zero-ETL 同步来的单份数据,可同时给 BI 团队、ML 团队、多个业务部门只读访问,节省存储成本。
  4. 权限精细管控
    可以在数据共享粒度上控制哪些 schema / table 可见,消费账户无法修改数据,满足数据治理和合规要求。
  5. 成本控制
    使用Redshift Serverless时,计费粒度是分钟,也就是说一分钟内只要用了1秒1RPU都会算成一分钟满RPU。所以单独建个小集群用来同步数据,然后数据共享到大集群,能省大量成本。

如何使用AWS Zero-ETL不再赘述

详见:使用AWS Zero-ETL 实时同步MySQL库表到Redshift

需注意将数据同步到小集群,接下来使用数据共享到大集群

详见:在AWS Redshift 中使用数据共享 Data sharing

Zero-ETL 新增表需重新赋权

bash 复制代码
ALTER DATASHARE share ADD ALL TABLES IN SCHEMA india_fea;

GRANT USAGE ON DATABASE share TO user;
GRANT USAGE ON SCHEMA share.india_fea TO user;
GRANT SELECT ON all tables in SCHEMA share.india_fea to user;

Zero-ETL 若有表同步失败,可手动同步

bash 复制代码
ALTER DATABASE feat INTEGRATION REFRESH TABLE xx;
ALTER DATABASE feat INTEGRATION REFRESH TABLES a, b;
相关推荐
AKAMAI1 天前
黄仁勋喊出“推理拐点”,边缘推理的机会窗口打开了吗
人工智能·云计算
weixin_408318041 天前
腾讯云TRTC、声网、即构三款实时音视频SDK怎么选?2026实测对比
云计算·腾讯云·实时音视频
zhojiew1 天前
使用AWS中国区Lambda集成Glue Schema Registry消费Kafka消息的实践
大数据·spark·etl
腾讯蓝鲸智云1 天前
嘉为蓝鲸WeOps:47天周期常态化管理,全生命周期智能方案筑牢安全防线
运维·服务器·人工智能·自动化·云计算
互联网江湖1 天前
AI云计算时代:腾讯“搞钱”、阿里“撒币”、百度“登山”
人工智能·百度·云计算
debug 小菜鸟1 天前
优雅运维:cpolar+Rancher 打通本地与云端的容器管理闭环
云计算
zhojiew2 天前
在AWS中国区实现EKS跨VPC跨区域实现节点加入集群的实践
云计算·aws
bingHHB2 天前
铜排产线数字化升级实战-生产企业应该如何进行信息化建设
etl·集成学习
认真的薛薛2 天前
Terraform: AWS VPC+可SSH登录EC2
ssh·aws·terraform