为什么 AWS 数据库不讲 HTAP

在 AWS re:Invent 2023 掌门人 Adam Selipsky 的 Keynote 上,数据库方面最重磅的主题是 Zero-ETL,从 TP 数据库 (RDS, Aurora, DynamoDB) 同步数据到 AP 数据库 (Redshift)。

Zero-ETL 是 AWS 在去年 re:invent 2022 上推出的概念,今年则继续增强。这里 AWS 没有选择另一条路线 HTAP (Hybrid Transactional/Analytical Processing)。如果搜索 AWS 官网,反倒是 TiDB 的 HTAP 方案更显眼。

而 TiDB, OceanBase 还是阿里云官网上的 HTAP 内容则要多得多

TiDB 更进一步,还主办了 HTAP Summit

AWS HTAP 的不选择

假设 AWS 要讲 HTAP 故事的话,首先会面临一个问题,到底是在 Aurora 里讲,还是在 Redshift 里讲。我们先来看一下 AWS 里数据库产品相关的组织架构。

大主管是 Swami 博士,统管了数据库,大数据以及AI/机器学习

数据库部门负责人 1,主要负责 Aurora + Redshift

数据库部门负责人 2,主要负责 RDS + DynamoDB

大数据部门负责人

AI / 机器学习部门负责人

Aurora 和 Redshift 两个产品都由同一个 VP 负责。但 Aurora 和 Redshift 都是 AWS 的拳头产品,可能也是 AWS 所有产品线里,综合营收和利润排在前五的两大产品。所以无论把 HTAP 放哪个,可能都会对另一个产生很大负面影响。

另外不仅是对于 Aurora 或者 Redshift 的影响,对于其他数据库产品也会有影响。如果讲了 HTAP,像 RDS, DynamoDB 这两个核心产品,它们同步到数仓的故事该怎么讲呢。

所以,综合下来,AWS 选择推出 zero-ETL 这个概念,打造一个连接器的品牌,这样让所有的数据库产品线都能获益。

TiDB, OceanBase HTAP 的选择

对于像 TiDB, OceanBase 这样的单一数据库厂商,推出一个 all-in-one 的 HTAP 方案也是比较合理的。毕竟手上就一个数据库产品,把它的能力做大做强。

像 OceanBase 在前不久发布会上讲的一体化数据库,一个数据库,解决 80% 问题。国外对标这块的有 SingleStore

SingleStore 之前的名字叫 MemSQL,2020 年改名的时候号称是全球第一款云原生 HTAP 数据库。

顺便提一嘴,当下很火的数据库 Neon 也是由 SingleStore 的联合创始人/CTO 创立的。

阿里云 HTAP 的选择

阿里云在许多方面都借鉴了 AWS,但在 HTAP 这个点上,看起来是选择了和 AWS 相反的道路。

对标 AWS Aurora 的 PolarDB 讲 HTAP

对标 AWS Redshift 的 ADB 也讲 HTAP

之前还推出过一个 HybridDB,专门讲 HTAP,现在已经下线了。

还有 RDS + ClickHouse 构建一站式 HTAP 的解决方案

南橘北枳

HTAP (Hybrid Transactional/Analytical Processing) 这个概念,其实国内远比国外要流行。可能这也确实和市场有关,国内大家想要一个大而全的东西,而国外大家更喜欢各自做好一块事情,然后连接起来。就像国内的飞书做成了 all-in-one 的庞然大物,国外 Slack 还是专注于 IM,Email/文档有 Google Workspace,HR 则有 Workday。

而即使是底层的数据库系统也不能免俗吧。


💡 更多资讯,请关注 Bytebase 公号:Bytebase

相关推荐
SAP工博科技3 小时前
SAP 公有云 ERP 多工厂多生产线数据统一管理技术实现解析
大数据·运维·人工智能
YongCheng_Liang3 小时前
从零开始学虚拟化:桌面虚拟化(VDI)入门指南(架构 + 产品 + 部署)
运维·云计算
杜子不疼.3 小时前
【Linux】库制作与原理(二):动态库的制作与使用
linux·运维·服务器
倔强的石头_3 小时前
关系数据库替换用金仓:数据迁移过程中的完整性与一致性风险
数据库
Elastic 中国社区官方博客3 小时前
使用 Groq 与 Elasticsearch 进行智能查询
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
消失的旧时光-19433 小时前
Nginx 是什么?为什么它不写在代码里?——从 0 认识 Nginx
运维·服务器·nginx
BJ_Bonree3 小时前
4月17日,博睿数据受邀出席GOPS全球运维大会2026 · 深圳站!
大数据·运维·人工智能
RisunJan3 小时前
Linux命令-lpq(查看打印队列状态)
linux·运维·服务器
山君爱摸鱼3 小时前
Linux-服务进程
linux·运维·服务器
阿乐艾官3 小时前
【linux文件系统重要目录及命令解释】
linux·运维·服务器