432trino 内存相关配置

reservedBytes 预定的内存;Reservations 预定、预约;Revocable 可废止的,可撤回的;allocations 分配

/ui/api/worker/yj-datanode1-0460/status

返回worker 的 heap 和Processors(既cpu 数)

LocalMemoryManager 管理 MemoryPool,MemoryPool=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

trino_memory_MemoryPool_MaxBytes{subcluster="subcluster",instance=\~"datanode"}

trino_memory_MemoryPool_FreeBytes{subcluster="subcluster",instance=\~"datanode"}

trino_memory_MemoryPool_ReservedBytes{subcluster="subcluster",instance=\~"datanode"}

worker 内存

maxBytes=heap - (memory.heap-headroom-per-node,默认=heap*0.3)

FreeBytes = maxBytes - reservedBytes - reservedRevocableBytes

cluster 内存

ClusterMemoryPool

blockedNodes 可以用于监控某个机器有没有空闲资源 FreeBytes() + ReservedRevocableBytes() <=0

totalDistributedBytes=sum_node(MaxBytes)

reservedDistributedBytes=sum_node(ReservedBytes)

reservedRevocableDistributedBytes=sume_node(ReservedRevocableBytes)

clusterMemorymanager

clusterMemoryBytes=sum_node(MaxBytes)

totalAvailableProcessors=sum_node(AvailableProcessors)

clusterUserMemoryReservation=sum_query(UserMemoryReservation)

clusterTotalMemoryReservation=sum_query(TotalMemoryReservation)

trino 查询模型

node 可以运行多个task, task 处理多个split

query-stage-task-split(driver)

task 配置

task.concurrency 并行运算符(例如连接和聚合)的默认本地并发性,默认值:节点的物理CPU数量,最小值为2,最大值为32

task.max-drivers-per-task 控制task同时运行的最大driver数量,默认值: max_int

task.max-worker-threads 设置task处理分片时使用的线程数。如果工作器 CPU 利用率较低且所有线程都在使用中,则增加此数字可以提高吞吐量,但这会导致堆空间使用量增加,默认值: cpu*2

node 配置

node-scheduler.max-splits-per-node 增加此值可以改善查询延迟 默认值:256

node-scheduler.min-pending-splits-per-task 默认值:16

node-scheduler.max-adjusted-pending-splits-per-task 默认值:2000

相关推荐
数在表哥16 分钟前
从数据沼泽到智能决策:数据驱动与AI融合的中台建设方法论与技术实践指南(四)
大数据·人工智能
爱思德学术25 分钟前
中国计算机学会(CCF)推荐学术会议-C(数据库/数据挖掘/内容检索):PAKDD 2026
大数据·机器学习·数据挖掘·知识发现
云淡风轻~~2 小时前
构建和部署Spark、Hadoop与Zeppelin集成环境
大数据·hadoop·spark
IT研究室2 小时前
大数据毕业设计选题推荐-基于大数据的人体体能活动能量消耗数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
元基时代2 小时前
视频图文矩阵发布系统企业
大数据·人工智能·矩阵
IT研究室3 小时前
大数据毕业设计选题推荐-基于大数据的人类健康生活方式数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
大数据·生活·课程设计
武子康4 小时前
大数据-122 - Flink Watermark 全面解析:事件时间窗口、乱序处理与迟到数据完整指南
大数据·后端·flink
九河云6 小时前
在云计算环境中实施有效的数据安全策略
大数据·网络·数据库·云计算
Brianna Home6 小时前
从“码农”到“导演”:AI结对编程如何重塑软件工程范式
大数据·人工智能·深度学习·自然语言处理·chatgpt
云飞云共享云桌面7 小时前
SolidWorks服务器多人使用方案
大数据·运维·服务器·前端·网络·电脑·制造