TPC-H 基准测试:Databend Cloud 与 Snowflake 对比

快速概览

TPC-H

TPC-H 基准测试是评估决策支持系统的标准,专注于复杂查询和数据维护。在这项分析中,我们使用 TPC-H SF100(SF1 = 600万行)数据集比较了 Databend Cloud 和 Snowflake,该数据集包含 100GB 数据和大约 6 亿行,跨越 22 个查询。

免责声明

TPC 基准测试™ 和 TPC-H™ 是交易处理性能委员会(TPC)的商标。我们的基准测试虽然受到 TPC-H 的启发,但与官方 TPC-H 结果不直接可比。

Snowflake 和 Databend Cloud

  • Snowflake:Snowflake 因其先进的功能而闻名,例如分离存储和计算、按需可扩展计算、数据共享和克隆能力。
  • Databend Cloud :Databend Cloud 提供与 Snowflake 类似的功能,是一个云原生数据仓库,也将存储与计算分离,并根据需要提供可扩展的计算能力。 它是从开源 Databend 项目发展而来,定位为 Snowflake 的现代化、高性价比替代品,特别适合大规模分析。

性能和成本比较

  • 在数据加载方面,Databend 的成本比 Snowflake 低约 67%。
  • 在查询执行方面,Databend 比 Snowflake 约高出 60% 的成本效率。

注意

基准测试中没有进行调优。结果基于 Snowflake 和 Databend Cloud 的默认设置。 记住,不要只是相信我们的话 ------ 我们鼓励您自己运行并验证这些结果。

数据加载基准测试

表名 Snowflake(695s, 成本 $0.77) Databend Cloud(446s, 成本 $0.25) 行数
customer 18.137 13.436 15,000,000
lineitem 477.740 305.812 600,037,902
nation 1.347 0.708 25
orders 103.088 64.323 150,000,000
part 19.908 12.192 20,000,000
partsupp 67.410 45.346 80,000,000
region 0.743 0.725 5
supplier 3.000 3.687 10,000,000
总时间 695s 446s
总成本 $0.77 $0.25
存储大小 20.8GB 24.5GB

查询基准测试:冷启动

查询 Snowflake(总计 207s, 成本 $0.23) Databend Cloud(总计 166s, 成本 $0.09)
TPC-H 1 11.703 8.036
TPC-H 2 4.524 3.786
TPC-H 3 8.908 6.040
TPC-H 4 8.108 4.462
TPC-H 5 9.202 7.014
TPC-H 6 1.237 3.234
TPC-H 7 9.082 7.345
TPC-H 8 10.886 8.976
TPC-H 9 18.152 13.340
TPC-H 10 13.525 12.891
TPC-H 11 2.582 2.183
TPC-H 12 10.099 8.839
TPC-H 13 13.458 7.206
TPC-H 14 8.001 4.612
TPC-H 15 8.737 4.621
TPC-H 16 4.864 1.645
TPC-H 17 5.363 14.315
TPC-H 18 19.971 12.058
TPC-H 19 9.893 12.579
TPC-H 20 8.538 8.836
TPC-H 21 16.439 12.270
TPC-H 22 3.744 1.926
总时间 207s 166s
总成本 $0.23 $0.09

查询基准测试:热启动

查询 Snowflake (总计 138s, 花费 $0.15) Databend Cloud (总计 124s, 花费 $0.07)
TPC-H 1 8.934 7.568
TPC-H 2 3.018 3.125
TPC-H 3 6.089 5.234
TPC-H 4 4.914 3.392
TPC-H 5 5.800 4.857
TPC-H 6 0.891 2.142
TPC-H 7 5.381 4.389
TPC-H 8 5.724 5.887
TPC-H 9 10.283 9.621
TPC-H 10 10.368 8.524
TPC-H 11 1.165 1.364
TPC-H 12 7.052 5.352
TPC-H 13 12.829 6.180
TPC-H 14 3.288 2.725
TPC-H 15 3.475 2.748
TPC-H 16 4.094 1.124
TPC-H 17 4.203 13.757
TPC-H 18 18.583 11.630
TPC-H 19 3.888 7.881
TPC-H 20 6.379 5.797
TPC-H 21 10.287 9.806
TPC-H 22 1.573 1.122
总时间 138s 124s
总花费 $0.15 $0.07

复现基准测试

您可以按照以下步骤复现基准测试。

基准测试环境

Snowflake 和 Databend Cloud 都在类似条件下进行了测试:

参数 Snowflake Databend Cloud
计算集群大小 小型 小型
vCPU 16 16
价格 $4/小时 $2/小时
AWS 区域 us-east-2 us-east-2
存储 AWS S3 AWS S3
  • TPC-H SF100 数据集,来源于 Amazon Redshift,已经加载到 Databend Cloud 和 Snowflake 中,没有进行任何特定的调优。

基准测试方法

我们对查询执行进行了冷热两轮运行:

  1. 冷运行:在执行查询之前,数据仓库被挂起并恢复。
  2. 热运行:数据仓库没有被挂起,使用本地磁盘缓存。

先决条件

数据加载

  1. Snowflake 数据加载

  2. Databend Cloud 数据加载

TPC-H 查询

  1. Snowflake 查询

  2. Databend Cloud 查询

相关推荐
ouou06172 小时前
企业级NoSql数据库Redis集群
数据库·redis·nosql
F_D_Z2 小时前
【SQL】指定日期的产品价格
数据库·sql·mysql
axban3 小时前
QT M/V架构开发实战:QStringListModel介绍
开发语言·数据库·qt
Blossom.1183 小时前
从“能写”到“能干活”:大模型工具调用(Function-Calling)的工程化落地指南
数据库·人工智能·python·深度学习·机器学习·计算机视觉·oracle
麦聪聊数据3 小时前
如何使用 QuickAPI 快速连接 MySQL 数据库并发布 RESTful API
数据库·sql·mysql·restful·数据服务
shallwe小威3 小时前
SpringBoot集成ElasticSearch
数据库·spring boot·elasticsearch
蒋星熠3 小时前
破壁者指南:内网穿透技术的深度解构与实战方法
网络·数据库·redis·python·websocket·网络协议·udp
扬帆起航134 小时前
亚马逊新品推广破局指南:从手动试错到智能闭环的系统化路径
大数据·数据库·人工智能
嘻嘻哈哈曹先生4 小时前
Oracle数据库
数据库·oracle