Apache Doris 2.1.9 版本正式发布

亲爱的社区小伙伴们,Apache Doris 2.1.9 版本已正式发布。2.1.9 版本对湖仓一体、倒排索引、半结构化数据类型、查询优化器、执行引擎、存储管理进行了若干改进优化。欢迎大家下载使用。

官网下载: https://doris.apache.org/download

GitHub 下载: https://github.com/apache/doris/releases

行为变更

  • Audit Log 中的 SQLHash 通过当前执行的 SQL 精确计算,解决了同一请求中所有 SQL 使用相同 SQLHash 的问题。
  • 查询返回的 ColumnLabelName 与 SQL 中的输入完全一致。
  • 所有在用户属性中设置的变量,优先级均高于 session 级别设置的变量。

新功能

  • 在存储管理方面,禁止 rename 分区列。
  • FE 监控指标新增 Catalog、Database、Table 数量指标。

改进提升

倒排索引

  • VARIANT 类型中的 ARRAY 支持倒排索引。
  • Profile 中展示每个过滤条件的倒排索引性能指标。

查询优化器

  • 支持在聚合查询中使用 SELECT *,如果下层 relation 仅输出聚合 key 列。

存储管理

  • CCR 优化回收 binlog 效率、小文件传输效率,并增强了混沌环境下的健壮性。
  • 改进了导入的错误提示,使错误提示更加具体。

Bug 修复

湖仓一体

  • 修复 BE 端无法正确配置 krb5.conf 路径的问题。
  • 禁止 SELECT OUTFILE 语句重试以避免重复导出数据。
  • 修复无法通过 JAVA API 访问 Paimon 表的问题。
  • 修复无法写入存储位置为 s3a:// 的 Hive 表的问题。
  • 修复 Catalog 的 Comment 字段没有被持久化的问题。
  • 修复某些情况下,JDBC BE 端类加载泄漏的问题。
  • 修复 JDBC Catalog 无法使用高版本 ClickHouse JDBC Driver 的问题。
  • 修复某些情况下,读取 Iceberg Position Delete 导致 BE 宕机的问题。
  • 修复多分区列情况下读取 MaxCompute 表数据错误的问题。
  • 修复某些情况下读取 Parquet 复杂列类型错误的问题。

倒排索引

  • 修复 ARRAY 类型倒排索引空值处理错误的问题。
  • 修复对刚刚添加的列执行 BUILD INDEX 异常的问题。
  • 修复特殊字符 UTF8 编码索引被截断导致结果错误的问题。

半结构化数据类型

  • 修复 array_agg 函数在特殊情况下 crash 的问题。
  • 修复 Stream Load 导入 JSON 类型时,chunk 参数设置错误导致 crash 的问题。

查询优化器

  • 修复时间函数内嵌套 current_date 等关键字函数无法的进行常量折叠的问题。
  • 修复非确定性函数相关的结果错误问题。
  • 修复当原表有 on update 列属性时,CREATE TABLE LIKE 无法执行的问题。
  • 修复直查聚合模型表的物化视图可能产生非预期规划报错的问题。
  • 修复 PrepareStatement 因为内部 ID 溢出导致异常的问题。

查询执行引擎

  • 修复了查询系统表时,可能出现查询卡住或空指针的问题。
  • LEAD/LAG 函数支持了 DOUBLE 类型。
  • 修复了 case when 条件超过256个时,查询报错的问题。
  • 修复了 str_to_date 函数在空格的时候,结果错误的问题。
  • 修复了split_part 函数在常量折叠时遇到 || ,结果错误的问题。
  • 修复了 log 函数结果错误的问题。
  • 修复了 array / map 函数在 Lambda 表达式中使用时导致的 core 的问题。

存储管理

  • 修复了导入聚合表时,可能的内存写脏问题
  • 修复内存紧张时 MoW 导入偶发 coredump 问题。
  • 修复 MoW 在 BE 重启和 Schema Change 时可能出现重复 key 的问题。
  • 修复 Group Commit 和全局打开列更新以及 memtable 前移时的问题。

权限管理

  • 使用 LDAP 时不再会抛出 PartialResultException 异常。
相关推荐
猫猫头有亿点炸39 分钟前
大数据可能出现的bug之flume
大数据·bug·flume
小奕同学A1 小时前
数字化技术的五个环节:大数据、云计算、人工智能、区块链、移动互联网
大数据·人工智能·云计算
lilye661 小时前
精益数据分析(24/126):聚焦第一关键指标,驱动创业成功
数据挖掘·数据分析
weixin_307779135 小时前
分层设计数据仓库的架构和设计高效数据库系统的方法
数据仓库·架构
计算机毕设定制辅导-无忧学长6 小时前
TDengine 集群高可用方案设计(一)
大数据·时序数据库·tdengine
技术项目引流9 小时前
elasticsearch查询中的特殊字符影响分析
大数据·elasticsearch·搜索引擎
EasyDSS9 小时前
视频监控从安装到优化的技术指南,视频汇聚系统EasyCVR智能安防系统构建之道
大数据·网络·网络协议·音视频
IT成长日记9 小时前
【Hive入门】Hive查询语言(DQL)完全指南:从基础查询到高级分析
数据仓库·hive·hadoop·dql操作
lilye6610 小时前
精益数据分析(20/126):解析经典数据分析框架,助力创业增长
大数据·人工智能·数据分析