Apache Doris 4.0.1 版本正式发布

亲爱的社区小伙伴们,**Apache Doris 4.0.1 版本已于 2025 年 11 月 08 日正式发布。**此版本聚焦核心模块的打磨与优化,在 AI & Search 方面实现了重要能力扩展,同时全面提升了 Lakehouse 与查询引擎的稳定性和性能。

行为变更

  • SHOW PARTITIONS 命令不再支持 Iceberg 表,请直接使用 Iceberg 的 $partitions 系统表查看。#56985

新增功能

  • 新增 mmh64_v2 函数,用于生成与其他三方库相同的 Hash 结果。#57180
  • 新增 json_hash 函数,支持对 JSONB 类型生成 Hash 值。#56962
  • 新增 Binary 数据类型,并增加一系列函数 length、from_base64_binary、to_base64_bianry、sub_binary。#56648
  • 新增 sort_json_object_keys / normalize_json_numbers_to_double 函数,用于对 JSONB 的 Key 进行排序。
  • 新增与 MySQL 兼容的时间函数:UTC_DATE、UTC_TIME 及 UTC_TIMESTAMP。#57443
  • 新增对 MaxCompute Schema 层级的支持。 #56874
  • JSON_OBJECT 函数支持使用 * 作为参数。#57256

功能改进

  • 为 SEARCH 函数新增短语查询、通配符查询和正则查询支持。#57372 #57007
  • 扩展 SEARCH 函数参数,新增可选的 default_field 参数(默认列)和 default_operator 参数(指定多列查询的布尔运算符为 "and" 或 "or")。#57312
  • SEARCH 函数新增对 Variant 类型子列的搜索支持,可通过点号语法(如 variantColumn.subcolumn:关键词)直接搜索 JSON 路径中的特定字段。
  • 将倒排索引的默认存储格式由 V2 升级为 V3 版本。#57140
  • 完善自定义分词器 Pipeline 支持,新增 char_filter 组件;在 Analyzer 框架中新增 Basic Tokenizer 和 和 ICU Tokenizer 两种内置分词器支持;新增内置分词器别名并支持组件同名配置,优化统一 Analyzer 框架。#57055

Lakehouse

  • 新增会话变量 merge_io_read_slice_size_bytes 来解决某些情况下,外表 Merge IO 读放大严重的问题。

查询

  • 优化了 JOIN Shuffle 选择算法 #56279

其他

  • 优化了物理计划中 Runtime Filter 序列化信息的大小 #56978

问题修复

  • 修复非分词字段的 SEARCH 查询结果问题,支持在 MOW 表上执行 SEARCH 函数查询 #56927
  • 修复倒排索引在执行 IS NULL 谓词过滤时的计算错误问题 #56964

Lakehouse

  • 修复某些情况下,谓词下推无法使用 Parquet Page Index 的问题 #55795
  • 修复某些情况下外表查询分片读取丢失的问题 #57071
  • 修复某些情况下,Hadoop 文件系统缓存开启导致修改 Catalog 属性不生效的问题 #57063
  • 修复某些情况下,从旧版本升级时,连接属性校验导致元数据回放失败的问题 #56929
  • 修复某些情况下,Refresh Catalog 导致 FE 线程死锁的问题 #56639
  • 修复无法读取由 Hive 转换生成的 Iceberg 表的问题 #56918
  • 修复某些情况下收集 Query Profile 导致 BE 宕机的问题 #56806

查询

  • 修复 datetime 类型在 Timezone 相关 Cast 时,边界条件下结果错误的问题 #57422
  • 修复部分 datetime 相关函数结果精度推导不正确的问题 #56671
  • 修复 inf 作为 float 的谓词条件时 Core 的问题 #57100
  • 修复 explode 函数在可变参数下 Core 的问题 #56991
  • 修复 decimal256 到 float 类型的 Cast 不稳定的问题 #56848
  • 修复 Spill Disk 时可能出现重复调度导致 Core 的问题 #56755
  • 修复偶发的错误调整 Mark Join 和其他 Join 顺序的问题 #56837
  • 修复部分命令未被正确转发到 Master Frontend 执行的问题 #55185
  • 修复偶现的窗口函数错误生成 Partition TopN 的问题 #56622
  • 修复当同步物化视图定义中存在关键字时,查询可能报错的问题 #57052

其他

  • 禁止基于同步物化视图创建另外一个同步物化视图 #56912
  • 修复 Profile 中存在内存未及时释放问题 #57257
相关推荐
努力努力再努力wz8 小时前
【内存管理与高并发内存池系列】从 mmap 到 malloc:文件映射、匿名映射与 glibc 内存分配机制详解
linux·c语言·数据结构·数据库·c++·qt·链表
JdSnE27zv8 小时前
Qt 操作SQLite数据库
数据库·qt·sqlite
tedcloud1239 小时前
HyperFrames部署教程:用HTML生成MP4视频
前端·数据库·人工智能·html·音视频
布朗克1689 小时前
25 IO流高级操作——序列化、NIO与Files工具类
java·数据库·io·nio
阿演9 小时前
DataDjinn 新版本更新:新增 Oracle 支持,查询窗口、表预览和连接树继续打磨
数据库·oracle·ai编程·数据库连接工具
lixora9 小时前
Oracle 11g Active Data Guard Go 自动化部署工具 v1.0
数据库·oracle
Nturmoils9 小时前
自增主键别只会 auto_increment,先把值从哪来讲清楚
数据库·后端
叶小鸡9 小时前
Java 篇-项目实战-AI 天机学堂(从 0 到 1)-day5
数据库·redis·缓存
mN9B2uk179 小时前
大数据量高并发的数据库优化
服务器·数据库·oracle
Database_Cool_10 小时前
PolarSearch AutoETL:让数据库内置搜索不再需要搬运工
数据库