Apache Doris 2.1.1 版本正式发布!

亲爱的社区小伙伴们,Apache Doris 2.1.1 版本已于 2024 年 4 月 3 日正式发布。该版本针对 2.1.0 版本出现的问题进行较为全面的优化,提交了若干改进项以及问题修复,进一步提升了系统的性能及稳定性,欢迎大家下载体验。

1 行为变更

  1. 改变了 Float 类型字段返回值序列化的方式,可以提升大数据量下 Float 返回的性能。

  2. 将部分 Table Valued Function 变更为系统表 active_queries(), workload_groups()

  3. 由于 show query``/l``oad profile stmt 语句在实际用户场景中使用较少,该语句将不再支持与维护。同时该功能在 Pipeline 与 PipelineX 引擎中不支持。

  4. 升级 Arrow Flight 版本至 15.0.2,同时用户需要使用 ADBC 15.0.2 版本访问 Doris。

2 升级问题

  1. 修复了从 2.0.x 滚动升级至 2.1.x 的过程中,部分 BE 节点升级出现 Core 的问题。

  2. 修复了在 2.0.x 滚动升级至 2.1.x 过程中,使用 JDBC Catalog 会出现 Query 报错的问题。

3 新功能

  1. 默认开启列级权限。

  2. Pipeline 和 PipelineX 引擎能够在 K8S 下准确获取 CPU 核数。

  3. 支持读取 Parquet INT96 类型

  4. 支持 IP 透传的协议,以方便在 FE 之前启用代理的同时还能获取客户端准确的 IP 地址,实现白名单权限控制。

  5. 增加对 Workload Queue 检测指标。

  6. 增加系统表 backend_active_tasks ,以实时监测每个 BE 上活跃任务以及消耗的资源信息。

  7. 在 Spark Doris Connector 中增加 IPV4 和 IPV6 的支持。

  8. CCR 支持倒排索引。

  9. 支持查询 Experimental 的 Session Variable。

  10. 支持建立 bitmap_union(bitmap_from_array()) 函数的物化视图。

  11. 支持对 Hive 中 HIVE_DEFAULT_PARTITION 分区进行列裁剪。

  12. 支持 set variable 语句中使用函数。

  13. Arrow 序列化方式增加对 Variant 类型的支持。

4 改进与优化

  1. 当系统自动重启或者滚动升级之后,自动启动 Routine Load 导入任务。

  2. 优化了 Routine Load 任务在各个 BE 上的分布方式,让各个 BE 负载更加均衡。

  3. 升级 Spark 的版本,解决部分 Spark Load 的安全问题。

  4. 在冷热分离过程中,自动跳过被删除的 Tablet.

  5. Workload Group 支持对 Routine Load 的资源进行限制。

  6. 大幅度优化多表物化视图查询改写性能。

  7. 优化 Broker Load 任务对 FE 的内存使用

  8. 优化 Partition 的裁剪逻辑。

  9. 优化 Tablet Schema Cache 对 BE 内存使用。

  10. 多表物化视图增加更多对 JOIN 类型的支持,包括 INNER JOIN、LEFT OUTER JOIN、RIGHT OUTER JOIN、FULL OUTER JOIN、LEFT SEMI JOIN、RIGHT SEMI JOIN、LEFT ANTI JOIN、RIGHT ANTI JOIN

5 Bugs 修复

  1. 修复 TopN 下推导致的问题。

  2. 修复 JAVA UDF 带来的内存泄露问题。

  3. 修复 ODBC 表备份恢复问题。

  4. 修复对 Variant 类型进行运算时常量折叠会导致 BE 出错的问题

  5. 修复了部分导入任务失败时 Routine Load 卡住的问题。

  6. 修复 SEMI JOIN 结果不正确的问题。

  7. 当列的数据为空时,修复建立倒排索引会出错的问题。

  8. 修复<=> join 操作会出现 Core 的问题。

  9. 修复部分列更新在有 Sequence 列结果准确性的问题。

  10. 修复 Select Outfile 导出到 Parquet 或者 ORC 格式的列类型映射问题。

  11. 修复在 Restore 过程中 BE 有时候会 Core 的问题。

  12. 修复 array_agg 函数结果不对的问题。

  13. 使 Variant 类型应当一直是 nullable.

  14. 修复 Schema Change 没有正确处理空 Block 的问题。

  15. 修复使用 json_length() 函数时部分场景会出错的问题。

  16. 修复 Iceberg 表没有正确处理 Date Cast 转换的问题。

  17. 修复 Variant 类型建立 Index 时出现的部分 Bug。

  18. 修复当多个 map_agg 函数同时使用时结果不正确的问题。

  19. 修复 money_format 函数的返回结果不正确的问题。

  20. 修复在高并发的建立链接时部分请求会卡住的问题。

相关推荐
权^1 分钟前
MySQL--聚合查询、联合查询、子查询、合并查询(上万字超详解!!!)
大数据·数据库·学习·mysql
杨荧38 分钟前
【JAVA开源】基于Vue和SpringBoot的旅游管理系统
java·vue.js·spring boot·spring cloud·开源·旅游
Code成立43 分钟前
1、深入理解Redis线程模型
数据库·redis·bootstrap
缘友一世3 小时前
macos安装mongodb
数据库·mongodb·macos
万事大吉CC4 小时前
mysql单表查询·3
数据库·mysql
bin91535 小时前
【EXCEL数据处理】000010 案列 EXCEL文本型和常规型转换。使用的软件是微软的Excel操作的。处理数据的目的是让数据更直观的显示出来,方便查看。
大数据·数据库·信息可视化·数据挖掘·数据分析·excel·数据可视化
Miqiuha5 小时前
lock_guard和unique_lock学习总结
java·数据库·学习
一 乐6 小时前
学籍管理平台|在线学籍管理平台系统|基于Springboot+VUE的在线学籍管理平台系统设计与实现(源码+数据库+文档)
java·数据库·vue.js·spring boot·后端·学习
极客先躯7 小时前
Hadoop krb5.conf 配置详解
大数据·hadoop·分布式·kerberos·krb5.conf·认证系统
Java探秘者10 小时前
Maven下载、安装与环境配置详解:从零开始搭建高效Java开发环境
java·开发语言·数据库·spring boot·spring cloud·maven·idea