Starrocks 存算分离 VS Trino 性能测试

Starrocks 存算分离 VS Trino 性能测试

集群规模

  • Starrocks :存算分离 ON HDFS;8C 48G * 4 个 compute_nodes 1 个 FE 节点 4C8G;开启 datacache
  • Trino : 13C 60G * 56 WORKER ; 整个公司公用,测试时负载较低;

测试结果记录

公司数仓生产数据,Trino 直连 Hive; Starrocks 使用 Hive catalog 外表进行查询:

  • 测试1 : select count(1) from prd_ods.test_tb where dt >='20240101'

    数据量:145661928137

    Trino耗时:2m6s

    Starrocks耗时: 1m30s

  • 测试2: select min(dt),max(dt) from hive.prd_ods.test_tb where dt >='20240101';

    数据: 145661928137

    Trino耗时:1m 40s

    Starrocks耗时: 4s

  • 测试3:select count(1) from hive.prd_ods.test_tb where dt ='20240131';

    数据: 2376708461

    Trino耗时:31s

    Starrocks耗时: 5s

  • 测试5 :

    sql 复制代码
    select  good_code,address_code,sum(money),sum(qty)
    from hive.prd_ods.test_tb  where dt  ='20240131'
    group by good_code,address_code ;

    数据: 2376708461

    Trino耗时:累计使用内存达到 22T 查询失败(控制程序 KILL 大查询)

    Starrocks耗时: 13s

  • 测试 6 :

    sql 复制代码
    select *
    from hive.prd_ods.test_tb where dt  ='20240131' and good_code = 'xxxx' and address_code = 'xxxx';

    数据: 2376708461

    Trino耗时:19s

    Starrocks耗时: 9s

总结

此次分别从 聚合, 点查,分组等各种SQL进行测试;数据量都在 10 亿级别;综合性能 SR 领先 Trino。测完 下班 !!!

相关推荐
Danileaf_Guo5 小时前
256台H100服务器算力中心的带外管理网络建设方案
运维·服务器
Robot侠6 小时前
极简LLM入门指南4
大数据·python·llm·prompt·提示工程
技术钱7 小时前
vue3解决大数据加载页面卡顿问题
大数据
拾贰_C7 小时前
【Linux | Windows | Terminal Command】 Linux---grep | Windows--- findstr
linux·运维·服务器
虹科网络安全8 小时前
艾体宝洞察 | 利用“隐形字符”的钓鱼邮件:传统防御为何失效,AI安全意识培训如何补上最后一道防线
运维·网络·安全
石像鬼₧魂石8 小时前
Kali Linux 网络端口深度扫描
linux·运维·网络
alengan8 小时前
linux上面写python3日志服务器
linux·运维·服务器
yBmZlQzJ9 小时前
免费内网穿透-端口转发配置介绍
运维·经验分享·docker·容器·1024程序员节
JH30739 小时前
docker 新手入门:10分钟搞定基础使用
运维·docker·容器
福客AI智能客服9 小时前
从被动响应到主动赋能:家具行业客服机器人的革新路径
大数据·人工智能