亲爱的社区小伙伴们,**Apache Doris 4.0.1 版本已于 2025 年 11 月 08 日正式发布。**此版本聚焦核心模块的打磨与优化,在 AI & Search 方面实现了重要能力扩展,同时全面提升了 Lakehouse 与查询引擎的稳定性和性能。
- GitHub 下载:github.com/apache/dori...
- 官网下载:doris.apache.org/download
行为变更
SHOW PARTITIONS命令不再支持 Iceberg 表,请直接使用 Iceberg 的$partitions系统表查看。#56985
新增功能
- 新增 mmh64_v2 函数,用于生成与其他三方库相同的 Hash 结果。#57180
- 新增 json_hash 函数,支持对 JSONB 类型生成 Hash 值。#56962
- 新增 Binary 数据类型,并增加一系列函数 length、from_base64_binary、to_base64_bianry、sub_binary。#56648
- 新增 sort_json_object_keys / normalize_json_numbers_to_double 函数,用于对 JSONB 的 Key 进行排序。
- 新增与 MySQL 兼容的时间函数:UTC_DATE、UTC_TIME 及 UTC_TIMESTAMP。#57443
- 新增对 MaxCompute Schema 层级的支持。 #56874
- JSON_OBJECT 函数支持使用 * 作为参数。#57256
功能改进
AI & Search
- 为 SEARCH 函数新增短语查询、通配符查询和正则查询支持。#57372 #57007
- 扩展 SEARCH 函数参数,新增可选的 default_field 参数(默认列)和 default_operator 参数(指定多列查询的布尔运算符为 "and" 或 "or")。#57312
- SEARCH 函数新增对 Variant 类型子列的搜索支持,可通过点号语法(如 variantColumn.subcolumn:关键词)直接搜索 JSON 路径中的特定字段。
- 将倒排索引的默认存储格式由 V2 升级为 V3 版本。#57140
- 完善自定义分词器 Pipeline 支持,新增 char_filter 组件;在 Analyzer 框架中新增 Basic Tokenizer 和 和 ICU Tokenizer 两种内置分词器支持;新增内置分词器别名并支持组件同名配置,优化统一 Analyzer 框架。#57055
Lakehouse
- 新增会话变量
merge_io_read_slice_size_bytes来解决某些情况下,外表 Merge IO 读放大严重的问题。
查询
- 优化了 JOIN Shuffle 选择算法 #56279
其他
- 优化了物理计划中 Runtime Filter 序列化信息的大小 #56978
问题修复
AI & Search
- 修复非分词字段的 SEARCH 查询结果问题,支持在 MOW 表上执行 SEARCH 函数查询 #56927
- 修复倒排索引在执行 IS NULL 谓词过滤时的计算错误问题 #56964
Lakehouse
- 修复某些情况下,谓词下推无法使用 Parquet Page Index 的问题 #55795
- 修复某些情况下外表查询分片读取丢失的问题 #57071
- 修复某些情况下,Hadoop 文件系统缓存开启导致修改 Catalog 属性不生效的问题 #57063
- 修复某些情况下,从旧版本升级时,连接属性校验导致元数据回放失败的问题 #56929
- 修复某些情况下,Refresh Catalog 导致 FE 线程死锁的问题 #56639
- 修复无法读取由 Hive 转换生成的 Iceberg 表的问题 #56918
- 修复某些情况下收集 Query Profile 导致 BE 宕机的问题 #56806
查询
- 修复 datetime 类型在 Timezone 相关 Cast 时,边界条件下结果错误的问题 #57422
- 修复部分 datetime 相关函数结果精度推导不正确的问题 #56671
- 修复 inf 作为 float 的谓词条件时 Core 的问题 #57100
- 修复 explode 函数在可变参数下 Core 的问题 #56991
- 修复 decimal256 到 float 类型的 Cast 不稳定的问题 #56848
- 修复 Spill Disk 时可能出现重复调度导致 Core 的问题 #56755
- 修复偶发的错误调整 Mark Join 和其他 Join 顺序的问题 #56837
- 修复部分命令未被正确转发到 Master Frontend 执行的问题 #55185
- 修复偶现的窗口函数错误生成 Partition TopN 的问题 #56622
- 修复当同步物化视图定义中存在关键字时,查询可能报错的问题 #57052
其他
- 禁止基于同步物化视图创建另外一个同步物化视图 #56912
- 修复 Profile 中存在内存未及时释放问题 #57257