Starrocks 存算分离 VS Trino 性能测试

Starrocks 存算分离 VS Trino 性能测试

集群规模

  • Starrocks :存算分离 ON HDFS;8C 48G * 4 个 compute_nodes 1 个 FE 节点 4C8G;开启 datacache
  • Trino : 13C 60G * 56 WORKER ; 整个公司公用,测试时负载较低;

测试结果记录

公司数仓生产数据,Trino 直连 Hive; Starrocks 使用 Hive catalog 外表进行查询:

  • 测试1 : select count(1) from prd_ods.test_tb where dt >='20240101'

    数据量:145661928137

    Trino耗时:2m6s

    Starrocks耗时: 1m30s

  • 测试2: select min(dt),max(dt) from hive.prd_ods.test_tb where dt >='20240101';

    数据: 145661928137

    Trino耗时:1m 40s

    Starrocks耗时: 4s

  • 测试3:select count(1) from hive.prd_ods.test_tb where dt ='20240131';

    数据: 2376708461

    Trino耗时:31s

    Starrocks耗时: 5s

  • 测试5 :

    sql 复制代码
    select  good_code,address_code,sum(money),sum(qty)
    from hive.prd_ods.test_tb  where dt  ='20240131'
    group by good_code,address_code ;

    数据: 2376708461

    Trino耗时:累计使用内存达到 22T 查询失败(控制程序 KILL 大查询)

    Starrocks耗时: 13s

  • 测试 6 :

    sql 复制代码
    select *
    from hive.prd_ods.test_tb where dt  ='20240131' and good_code = 'xxxx' and address_code = 'xxxx';

    数据: 2376708461

    Trino耗时:19s

    Starrocks耗时: 9s

总结

此次分别从 聚合, 点查,分组等各种SQL进行测试;数据量都在 10 亿级别;综合性能 SR 领先 Trino。测完 下班 !!!

相关推荐
焦耳热科技前沿31 分钟前
北京科技大学/理化所ACS Nano:混合价态Cu₂Sb金属间化合物实现高效尿素电合成
大数据·人工智能·自动化·能源·材料工程
min1811234561 小时前
深度伪造内容的检测与溯源技术
大数据·网络·人工智能
武子康2 小时前
大数据-209 深度理解逻辑回归(Logistic Regression)与梯度下降优化算法
大数据·后端·机器学习
数据智研2 小时前
【数据分享】(2005–2016年)基于水资源承载力的华北地区降水与地下水要素数据
大数据·人工智能·信息可视化·数据分析
RisunJan3 小时前
Linux命令-ipcs命令(报告进程间通信(IPC)设施状态的实用工具)
linux·运维·服务器
TDengine (老段)4 小时前
TDengine Python 连接器入门指南
大数据·数据库·python·物联网·时序数据库·tdengine·涛思数据
亚古数据4 小时前
亚古数据:查询斯里兰卡公司可以获取什么文件和信息?
大数据·亚古数据·斯里兰卡公司查询
WLJT1231231234 小时前
守护自然与滋养民生的绿色之路
大数据·安全
HABuo4 小时前
【Linux进程(四)】进程切换&环境变量深入剖析
linux·运维·服务器·c语言·c++·ubuntu·centos