数据库管理-第404期 Oracle AI DB 23.26.1新特性一览(20260128)

数据库管理404期 2026-01-28

数据库管理-第404期 Oracle AI DB 23.26.1新特性一览(20260128)

text 复制代码
作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Pro: Database
PostgreSQL ACE

10年数据库行业经验
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP,ITPUB认证专家
圈内拥有"总监"称号,非著名社恐(社交恐怖分子)

公众号:胖头鱼的鱼缸
CSDN:胖头鱼的鱼缸(尹海文)
墨天轮:胖头鱼的鱼缸
ITPUB:yhw1809
IFClub:胖头鱼的鱼缸
除授权转载并标明出处外,均为"非法"抄袭

在今天(2026年1月28日)凌晨,Oracle终于放出Oracle AI Database的线下部署版本(23.26.1),下载页面地址为:

https://www.oracle.com/database/technologies/oracle26ai-linux-downloads.html

同时对应新版本的新特性也随之更新,本期则介绍23.26.1新特性,前面版本新增特性可参考:
数据库管理-第225期 Oracle DB 23.5新特性一览(20240730)
数据库管理-第256期 Oracle DB 23.6新特性一览(20241031)
数据库管理-第287期 Oracle DB 23.7新特性一览(20250124)
数据库管理-第316期 Oracle DB 23.8新特性一览(20250417)
数据库管理-第349期 Oracle DB 23.9新特性一览(20250717)
数据库管理-第376期 Oracle AI DB 23.26新特性一览(20251016)

JSON搜索索引的ALTER INDEX语句支持

JSON搜索索引支持执行ALTER INDEX语句操作,这意味着无需删除并重新创建索引,即可修改索引的路径子集化配置。

重新定义索引行为时,无需删除原有索引再新建索引,这一特性为开发人员提升了开发过程中的灵活性与敏捷性。

聚合过滤子句

新增的FILTER子句可按照SQL标准的规定,对Oracle SQL聚合函数的计算结果进行筛选。

该特性允许在聚合函数内部直接应用筛选条件,针对性解决分析型查询中常见的问题痛点,让查询语句更清晰、执行效率更高、运行更稳定;同时FILTER子句也能帮助开发人员使用SQL编写更复杂的分析型查询。

IVF向量索引自动重组

当数据库系统判定IVF向量索引需要重建时,会自动对其执行重组操作,整个过程无需人工介入。

随着时间推移,若映射至单个质心的数据点数量不断增加,或数据与质心的映射关系出现偏移,IVF向量索引的性能将会逐渐下降。为改善这一状况,就需要对IVF向量索引进行重组。该特性免去了人工设定阈值并判断索引是否需要重建的操作,相关判定工作均由数据库系统自动完成。

日历函数(Calendar Functions)

这一系列新增的日历函数,支持用户从公历、会计日历和零售日历中提取年、季度、月、周、日的相关时间信息。

日历函数可在公历、会计日历与零售日历的时间维度上,实现一致性的查询、分组和遍历操作,以此简化各类基于时间的分析工作。

Oracle Data Guard 的配置与成员标记功能

Oracle Data Guard代理支持为配置成员分配用户自定义的键值对标记,借助机房位置、生命周期状态、所属组织或合规要求等维度的信息,可轻松对配置成员实现逻辑分组,用户还能根据自身业务流程灵活选择任意命名规则。

为配置成员添加标记后,技术团队可按照业务需求对其进行规范化管理。该功能既能够提升Data Guard环境的监控与管理效率、支持合规性追踪、助力配置成员的分类梳理,还能减少操作失误,最终帮助团队更好地管控整个Data Guard环境。

面向SecureFile LOB的DBMS_SECUREFILES包

DBMS_SECUREFILES系统包为各类高级SecureFile子程序提供增强支持,功能核心聚焦于可诊断性分析、建议性指导与故障修复三大方向。

该包大幅简化了SecureFile大型对象的日常管理操作。

数据库可观测性

Oracle内核服务分布式追踪(KSTRC)基础设施,提供了一款基于统一追踪服务(UTS/DBGT)构建的分布式追踪能力,该能力为理解分布式系统中的复杂操作打造了强大的可观测性框架,支持业务端深入分析自身代码的执行过程、定位潜在问题。Oracle数据库原生支持OpenTelemetry单追踪链路/单追踪跨度能力,可助力调试端到端的业务问题;Oracle数据库的追踪跨度,还可与支持 OpenTelemetry 的业务端实现关联。开发人员基于KSTRC能力,能够提升应用程序的可靠性、性能与可维护性。指标模块则支持在VOS基础设施内完成指标的采集与管理工作。

KSTRC为Oracle数据库提供了一套全面的可观测性框架,其分布式追踪能力支持客户对复杂操作开展端到端的全链路追踪,进而精准定位性能瓶颈。借助上述能力组件,客户可实现以下目标:

  1. 快速排查问题:依托精细化的追踪数据与指标信息,客户能够快速定位并诊断问题,有效缩短平均检测时间(MTTD)与平均解决时间(MTTR)。
  2. 主动式性能优化:客户可利用指标与追踪数据开展数据库性能优化,降低问题发生概率,提升整体系统运行效率。

KSMET与KSTRC提供了丰富的指标和追踪数据,为性能监控与分析工作提供强化支撑,可直接用于数据库性能分析。借助二者,客户还能实现以下操作:

  1. 监控关键性能指标(KPI):KSMET可采集数据库性能相关指标,包括操作次数、延迟、吞吐量等,客户可通过这些指标监控 KPI,定位性能优化空间。
  2. 分析追踪数据:KSTRC的分布式追踪能力,支持客户对复杂操作进行深度分析,精准识别性能瓶颈。

基于RAC的分布式HNSW索引

RAC数据库上的分布式HNSW索引,如今可基于该RAC数据库所有实例的可用总内存实现无缝扩展。

HNSW向量索引存储于数据库系统全局区(SGA)中的向量内存池,而该向量内存池的资源受物理数据库服务器的可用内存量限制。借助RAC技术,数据库的系统全局区(SGA)与CPU数量可跨多个实例进行水平扩展。在RAC环境中启用分布式HNSW索引后,向量内存池如今能够跨多个RAC实例部署,这意味着数据库可支持更大规模的HNSW索引,同时可用于并行操作的CPU数量也会相应增加。

支持导入更大规模的 ONNX 格式模型

本特性支持导入超过1GB的开放神经网络交换(ONNX)格式模型,使其可在数据库内置的ONNX运行时中运行。这类模型包含以文本和图像为输入并生成向量的转换器模型(嵌入模型)。该能力通过外部初始化器实现,该机制支持将模型权重(常量)与ONNX计算图表示相分离,并对权重进行独立引用。Oracle Python机器学习库(OML4Py)可简化模型转换操作,支持从赫格脸(Hugging Face)平台或存储有微调模型的本地目录中转换模型。

使用更大规模的模型,能够提升预测精度,还能捕捉到概念之间的细微关联;同时也让用户可以利用更多种类的现成模型与自定义微调模型。此外,外部初始化器还支持在多个数据库进程间共享初始化器,从而提升内存使用效率。OML4Py可实现自动化处理,大幅简化带外部初始化器的ONNX格式模型的生成流程。

HNSW 索引的包含列功能

HNSW向量索引支持存储额外的非向量列。将该类额外列存储于索引内时,执行相似度检索查询的过程中,可直接省去从基表提取对应列数据的表访问操作。

HNSW向量索引的包含列功能,允许将基表中的额外非向量列纳入索引进行存储。把这些额外列存储在索引中后,查询执行时无需再通过额外的表访问从基表提取对应列数据,从而显著提升相似度检索查询的执行效率。

面向库内JavaScript的JavaScript Web API扩展

向MLE(多语言引擎)/JavaScript环境新增了更多常用Web API,旨在提升其与现有第三方JavaScript模块的兼容性。

通过支持更多扩展Web API,如今在数据库应用中使用来自社区代码仓库(如NPM)的第三方模块将更为便捷。此外,该增强特性还能减少开发人员编写自定义兼容补丁(polyfill)的需求。

DB Links的Kerberos约束委派功能

23.26.1和19.30版本更新中,新增了一个sqlnet.ora配置文件参数SQLNET.KERBEROS5_DELEGATION_MODE。

该新参数的有效值为 CONSTRAINED(约束式)和 UNCONSTRAINED(无约束式),默认值为 UNCONSTRAINED(无约束式)。

通过该新参数,用户无需再将Windows注册表项AllowTgtSessionKey配置为微软认定为不安全的取值。

LOB 迁移操作简化

使用SecureFiles迁移工具将BasicFile LOB段迁移并压缩为SecureFiles LOB段所需的操作步骤已得到精简。

该增强特性进一步简化了LOB段的整体迁移流程。

网络监控器

网络监控器(NMON)是一款低开销的网络监控服务,依托数据库高级内核特性实现全天候、全方位的监控能力。该服务可在多个维度持续采集网络统计数据与事件信息,涵盖系统全局、单网络接口、单IP地址及单网络流维度,为上层服务提供精细化的指标数据支撑。健康评分服务与网络诊断代理服务基于NMON构建,通过标准化0-100分的评分体系简化网络健康状态评估流程,并可根据实际需求采集诊断信息、执行流量重路由,实现网络问题的主动处置。

NMON可输出高效且具备实际指导价值的网络统计数据,助力技术人员及时发现网络异常,并实现网络状态与数据库业务操作的精准关联分析。

向量索引在线重建

如今可对向量索引执行在线创建或重建操作,操作过程中其关联的基表仍保持可用且支持更新。

对于存在频繁更新的表,其对应的向量索引易出现失衡情况,需要通过重建重新校准索引的查询精度。但对多数企业而言,业务相关的表和索引必须持续在线 ------ 这类企业在重建向量索引时,无法承受任何形式的停机时间。借助向量索引在线重建功能,即便在执行向量索引的创建或重建操作时,相关基表及对应的向量索引(HNSW、IVF)仍可保持开放状态,支持各类更新操作。

表达式分区

表达式分区功能支持在分区子句中直接通过表达式定义分区键,这就无需为充当分区键而单独创建虚拟列,实现了数据库模式设计的简化。

该特性省去了管理虚拟列的相关开销,不仅简化了数据定义语言(DDL)操作与分区的日常维护工作,还让分区定义更直观、更具表达性。开发人员可基于派生值(日期、子字符串、JSON 字段等)灵活进行分区设计,操作灵活性大幅提升,同时也能减少数据库模式的结构冗余。

后量子密码学支持

后量子密码学(PQC)也被称作抗量子密码学或量子安全密码学,是一类新型密码算法,其设计初衷是抵御未来大规模量子计算机的攻击,保障加密体系的安全性。

甲骨文AI数据库支持使用由美国国家标准与技术研究院(NIST)标准化的两种后量子密码学算法,即ML-KEM算法与ML-DSA算法。

后量子密码学算法基于各类不同的数学难题构建,例如格论、哈希函数、编码相关的数学难题,目前公认这些难题对传统计算机和量子计算机而言均难以破解。向後量子密码学体系迁移,是保护长期留存数据的一项关键主动防护措施;诸如医疗记录、知识产权这类数据,若如今被窃取,未来量子计算机问世后就可能被解密,而该迁移举措可有效规避这一风险。

甲骨文AI数据库26ai版本,为传输层安全(TLS)会话的密钥交换密文提供ML-KEM算法支持,同时也支持基于ML-KEM与ECDHE算法的混合密钥封装机制。该混合机制会融合ML-KEM与ECDHE两种算法生成的密钥交换密文,为TLS会话生成唯一的共享密文。若其中任意一种算法出现安全漏洞,混合密钥封装机制可提供关键的安全兜底能力。

此外,结合JDK 24及更高版本,甲骨文AI数据库26ai版本还支持创建ML-DSA自签名证书、读取ML-DSA证书,以及将ML-DSA证书添加至甲骨文钱包中。

全局IVF与HNSW索引的分区维护操作及直接加载支持

现在可对创建了全局IVF和HNSW索引的分区表执行分区维护操作,该类操作适用于采用各类分区方式构建的分区表,包括范围分区、列表分区、哈希分区以及复合分区。

针对创建了全局IVF和HNSW索引的分区表,可执行添加、删除、合并、拆分分区等各类分区维护操作。分区技术的核心优势之一,是为数据库运维赋予了更高的灵活性:能够单独对表的某个数据子集(即单个分区)执行维护操作,且不会对相邻分区中的数据行造成影响,这一特性同样适用于存储向量数据的分区表。

融合检索增强生成与合成数据生成的Select AI功能

Select AI功能现已支持检索增强生成(RAG)、合成数据生成(SDG)能力,同时兼容谷歌、安索普克、赫格脸(Hugging Face)三大AI服务商,这些增强特性在原有自然语言转SQL(NL2SQL)功能的基础上迭代升级。

甲骨文自治AI数据库中的Select AI功能已率先支持RAG、SDG能力及更多类型的AI服务商,本次升级让非自治AI数据库的用户也能获得高度的功能一致性。借助Select AI,开发人员可直接通过SQL和PL/SQL语言,基于大语言模型(LLM)与转换器模型快速开发人工智能应用。

检索增强生成(RAG)能力支持向大语言模型输入企业专属、实时性更强的业务数据,以此优化模型的响应结果,减少模型幻觉现象,从而让Select AI能适配更多业务场景。

合成数据生成(SDG)能力支持用户按需生成合成数据,这类数据的应用场景十分丰富。例如,可借助合成数据在无真实用户数据的前提下快速启动新项目,通过应用界面验证用户体验,或是为开发、测试场景填充元数据克隆库。

新增的AI服务商支持,为用户在Select AI中使用大语言模型和转换器模型提供了更多选择。

JSON索引的简易点标记法语法

现在可通过简易点标记法为JSON数据创建单值索引与多值索引。该特性针对Oracle MongoDB兼容API和SQL查询均做了性能优化,同时支持可选配置,能最大化常规查询的索引使用率。

JSON索引可通过省去全表扫描、降低连接操作开销大幅提升查询性能,这让复杂查询的数检索速度更快、执行效率更高。而简洁的索引创建语法,能够简化开发流程、提升开发效率。

借助断言(Assertions)简化数据完整性校验

断言功能支持用户为一个或多个数据表定义业务规则,确保对相关表执行的所有数据操纵语言(DML)操作始终遵循这些规则。目前实现该需求的传统方案(如检查约束、触发器)存在诸多局限性:检查约束仅能在列或行级别生效;触发器虽支持表级别校验,但在应对多表业务场景时,需要编写复杂的PL/SQL代码,且需进行精细化的管理。而借助断言,开发人员可通过简洁的声明式语法,将业务逻辑直接嵌入数据库中。

该特性能够降低数据不一致的风险,同时消除各应用系统中重复的校验代码。断言还会默认解决并发操作与序列化相关的问题。当业务规则发生变更时,只需更新对应的单个断言即可,相比修改多个业务代码库,这种方式更高效,且出错概率更低。

智能连接重均衡建议功能

SMART推荐引擎会分析各数据库服务的运行活动,评估在服务级别启用智能连接重均衡特性是否能提升数据库性能。针对每个数据库服务,该引擎会给出可落地的优化建议,这些建议可在自动工作负载库(AWR)报告与 (G) V$ACTIVE_SERVICES动态性能视图中查看。

遵循这些建议进行配置,能够提升数据库的整体性能,其中包括改善各数据库服务的吞吐量与响应时间。

DATEDIFF函数支持

DATEDIFF函数及其同义词TIMESTAMPDIFF函数被引入Oracle数据库环境,为日期时间差值计算提供了强大的实用工具;该功能依托数据库现有SQL内置函数,实现了更全面、更便捷的日期时间差计算方案。

目前其他所有主流数据库均已支持DATEDIFF函数,Oracle对该函数的支持,能大幅降低客户向Oracle数据库迁移的操作难度。

支持从数据库视图创建SQL属性图

甲骨文AI数据库支持利用数据库视图创建SQL属性图。

用户可基于各类数据库视图创建属性图,包括单表/多表视图、聚合视图、基于窗口函数/多态表函数的视图,以及混合分区表、数据库链接、对象表、表函数等相关视图;同时,属性图的创建也可使用包含伪列、虚拟列的视图,以及视图同义词、嵌套视图。

支持从数据库视图创建SQL属性图后,开发人员在构建属性图时拥有了更高的灵活性,如今更多数据源与数据库高级表特性均可被纳入属性图的构建中。例如,开发人员在创建属性图时,可便捷地通过数据库链接、数据湖中的外部表、基于PL/SQL函数生成的列表达式数据等多种方式访问各类数据源。

OCI会话池的True Cache支持

OCI对True Cache的支持为OCI会话池新增了一项配置选项:当数据库部署True Cache服务时,可在OCI会话池中申请True Cache连接。该特性允许应用程序通过单个会话池,同时管理与主数据库实例和True Cache实例的连接。

该特性可将True Cache实例与主数据库实例的连接整合至同一个会话池,能根据应用程序的只读操作和读写操作需求,实现数据库连接的高效共享。这就无需应用程序单独创建两个独立的会话池。借助该特性,从会话池获取连接时,可通过指定连接模式明确连接需求:是强制申请True Cache实例的连接、可选申请True Cache连接(仅当有可用连接时),还是仅申请主数据库实例的连接。

预编译器的向量数据类型支持

甲骨文推出了全新的VECTOR(向量)数据类型,同时对ProC和ProCOBOL两款预编译器完成功能增强,为该数据类型提供应用层的适配支持。应用程序可通过以下两种机制对VECTOR向量数据类型进行操作:

  1. 字符串表示法:应用程序可通过基于字符串的表示形式,对向量数据执行插入(INSERT)和提取(FETCH)操作。在此形式下,向量元素以逗号分隔的字符串格式呈现。
  2. 向量描述符表示法:也可通过描述符对VECTOR向量数据类型进行访问,该描述符是专为处理复杂数据类型设计的不透明结构。借助该机制,应用程序可对数组形式的向量数据执行插入和提取操作。

该特性让终端用户能更高效地存储、检索和处理向量数据,进而为相似度检索、机器学习、高级分析等现代业务负载提供技术支撑。

总结

本期是Oracle AI Database 26ai线下部署版本发布后第一期新特性一览,依然带来了很多扩展。

老规矩,知道写了些啥。

相关推荐
2401_838472511 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
砚边数影1 小时前
逻辑回归实战(一):用户流失预测数据集设计,KingbaseES存储标签数据
java·人工智能·算法·机器学习·逻辑回归·线性回归·金仓数据库
Yeats_Liao1 小时前
星图平台快速搭建 Clawdbot:私有化本地 Qwen3-VL:30B 并接入飞书平台(上篇)
人工智能·microsoft·飞书
姚远Oracle ACE1 小时前
使用RPM包安装 Oracle 26ai软件并建库
数据库·oracle
成都渲染101云渲染66661 小时前
渲染速度慢怎么办?如何将 Maya 渲染速度提升成百上千倍(通用方法)
人工智能·图形渲染·blender·maya·houdini
郝学胜-神的一滴1 小时前
特征选择利器:深入理解SelectKBest与单变量特征选择
人工智能·python·程序人生·机器学习·数据分析·scikit-learn·sklearn
shangjian0071 小时前
AI-大语言模型LLM-Transformer架构5-残差连接与前馈网络
人工智能·语言模型·transformer
酩酊仙人1 小时前
.Net机器学习入门
人工智能·机器学习·.net
pengdott1 小时前
Oracle RAC内存融合技术深度解析:PCM与非PCM资源的集群交响曲
数据库·oracle·pcm