为什么亚马逊云数据库不讲 HTAP

在 AWS re:Invent 2023 掌门人 Adam Selipsky 的 Keynote 上,数据库方面最重磅的主题是 Zero-ETL,从 TP 数据库 (RDS, Aurora, DynamoDB) 同步数据到 AP 数据库 (Redshift)。

Zero-ETL 是 AWS 在去年 re:invent 2022 上推出的概念,今年则继续增强。这里 AWS 没有选择另一条路线 HTAP (Hybrid Transactional/Analytical Processing)。如果搜索 AWS 官网,反倒是 TiDB 的 HTAP 方案更显眼。

而 TiDB, OceanBase 还是阿里云官网上的 HTAP 内容则要多得多

TiDB 更进一步,还主办了 HTAP Summit

AWS HTAP 的不选择

假设 AWS 要讲 HTAP 故事的话,首先会面临一个问题,到底是在 Aurora 里讲,还是在 Redshift 里讲。我们先来看一下 AWS 里数据库产品相关的组织架构。

大主管是 Swami 博士,统管了数据库,大数据以及AI/机器学习

数据库部门负责人 1,主要负责 Aurora + Redshift

数据库部门负责人 2,主要负责 RDS + DynamoDB

大数据部门负责人

AI / 机器学习部门负责人

Aurora 和 Redshift 两个产品都由同一个 VP 负责。但 Aurora 和 Redshift 都是 AWS 的拳头产品,可能也是 AWS 所有产品线里,综合营收和利润排在前五的两大产品。所以无论把 HTAP 放哪个,可能都会对另一个产生很大负面影响。

另外不仅是对于 Aurora 或者 Redshift 的影响,对于其他数据库产品也会有影响。如果讲了 HTAP,像 RDS, DynamoDB 这两个核心产品,它们同步到数仓的故事该怎么讲呢。

所以,综合下来,AWS 选择推出 zero-ETL 这个概念,打造一个连接器的品牌,这样让所有的数据库产品线都能获益。

TiDB, OceanBase HTAP 的选择

对于像 TiDB, OceanBase 这样的单一数据库厂商,推出一个 all-in-one 的 HTAP 方案也是比较合理的。毕竟手上就一个数据库产品,把它的能力做大做强。

像 OceanBase 在前不久发布会上讲的一体化数据库,一个数据库,解决 80% 问题。国外对标这块的有 SingleStore

SingleStore 之前的名字叫 MemSQL,2020 年改名的时候号称是全球第一款云原生 HTAP 数据库。

顺便提一嘴,当下很火的数据库 Neon 也是由 SingleStore 的联合创始人/CTO 创立的。

阿里云 HTAP 的选择

阿里云在许多方面都借鉴了 AWS,但在 HTAP 这个点上,看起来是选择了和 AWS 相反的道路。

对标 AWS Aurora 的 PolarDB 讲 HTAP

对标 AWS Redshift 的 ADB 也讲 HTAP

之前还推出过一个 HybridDB,专门讲 HTAP,现在已经下线了。

还有 RDS + ClickHouse 构建一站式 HTAP 的解决方案

南橘北枳

HTAP (Hybrid Transactional/Analytical Processing) 这个概念,其实国内远比国外要流行。可能这也确实和市场有关,国内大家想要一个大而全的东西,而国外大家更喜欢各自做好一块事情,然后连接起来。就像国内的飞书做成了 all-in-one 的庞然大物,国外 Slack 还是专注于 IM,Email/文档有 Google Workspace,HR 则有 Workday。

而即使是底层的数据库系统也不能免俗吧。


💡 更多资讯,请关注 Bytebase 公号:Bytebase

相关推荐
XiaoMu_00111 分钟前
【MongoDB与MySQL对比】
数据库
做科研的周师兄1 小时前
【机器学习入门】1.2 初识机器学习:从数据到智能的认知之旅
大数据·数据库·人工智能·python·机器学习·数据分析·机器人
qq_364371722 小时前
基于 Redis + JWT 的跨系统身份共享方案
数据库·redis
技术与健康2 小时前
LLM实践系列:利用LLM重构数据科学流程04 - 智能特征工程
数据库·人工智能·重构
007php0072 小时前
Jenkins+docker 微服务实现自动化部署安装和部署过程
运维·数据库·git·docker·微服务·自动化·jenkins
北极糊的狐2 小时前
MySQL常见报错分析及解决方案总结(1)---Can‘t connect to MySQL server on ‘localhost‘(10061)
数据库·mysql
SelectDB3 小时前
2-5 倍性能提升,30% 成本降低,阿里云 SelectDB 存算分离架构助力波司登集团实现降本增效
大数据·数据库·数据分析
SelectDB3 小时前
湖仓一体:小米集团基于 Apache Doris + Apache Paimon 实现 6 倍性能飞跃
数据库·开源·github
Hello.Reader4 小时前
Kafka 在 6 大典型用例的落地实践架构、参数与避坑清单
数据库·架构·kafka
数巨小码人4 小时前
AI+数据库:国内DBA职业发展与国产化转型实践
数据库·人工智能·ai·dba