云+AI 时代的 OceanBase

2024 年 10 月 23 日,OceanBase 年度发布会在北京成功举办。会上,CEO 杨冰表示,**OceanBase将继续践行一体化产品战略,不断演进产品能力,从支撑关键业务负载的OLTP能力,到实时分析的AP能力,再到应对海量数据及大规模场景所需的多模能力。**OceanBase正在不断打造面向多工作负载、多模及向量融合的一体化产品能力,以助力企业搭建现代数据架构,实现技术栈的简化。

本次发布会上,OceanBase 推出了两个里程碑版本OceanBase 4.2.5 LTS 版本 ,作为针对关键业务负载的全新长期支持版本,相较 4.2.1 LTS 版本在性能、稳定性和易用性方面都有显著提升,并在多模融合方面迈出了重要的一步。同时,发布面向实时 AP 场景的首个 GA 版本 4.3.3,对分析处理(AP)场景进行了大幅性能优化,特别是在海量数据分析时,显著缩短响应时间并提升吞吐能力。同时,4.3.3 引入了向量检索能力,通过向量多模一体化能力,极大简化 AI 应用的技术栈,帮助企业高效构建 AI 应用。

北京市经信局信息化与软件服务处处长赵祥伟为大会发表致辞,华东师范大学数据学院院长、 CCF 数据库专委会常委钱卫宁在大会伊始分享了中国数据库发展的机遇所在:**今天是中国数据库产业发展和数字化转型最好的时代,目前国内数据库正朝着"数据赋能"目标前进,"One Size Fits a Bunch"正在成为趋势。**同时,来自银行、保险、证券基金、运营商、零售、制造、互联网等行业的 40 余位客户代表齐聚发布会,先后分享了OceanBase 在攻坚关键业务系统以及简化技术栈降本增效上的落地实践。

1、"专有云"+"公有云"双引擎,驱动 OceanBase 高速发展

在发布会上,杨冰公布了 OceanBase 的最新商业化进展:目前,OceanBase 以专有云、公有云两个业务场景作为发展"双引擎",2024 年客户数已突破 2000 家,连续 4 年客户数增速超过 100%。

客户数从 2022 年的400+,到 2023 年的1000+,再到现在的2000+,OceanBase 已覆盖金融、政务、能源、运营商、交通、零售、制造、互联网等多个行业场景。在今天的主论坛上,来自交通银行、中国人保财险、中国联合航空和 T3 出行的客户代表分享了各自企业的数据库升级实践。

*图1-3依次为交通银行金融科技部高级专家黄颢、中国联合航空有限公司信息中心总经理冯振宇、T3 出行研发总监高建丰

*图4圆桌从左到右依次为钛媒体集团联合创始人&联席 CEO、ITValue 发起理事刘湘明、中国人保财险科技运营部副总经理张帆、中国联合航空有限公司信息中心总经理冯振宇、T3 出行研发总监高建丰、IDC 中国副总裁兼首席分析师武连峰

(一)专有云:全面构建现代数据架构,持续攻坚关键业务负载

作为"根自研"的原生分布式数据库,OceanBase 诞生于支付核心场景,历经十余年金融场景磨炼,从内部走向外部,在越来越多的金融核心场景中打磨产品核心能力,攻坚关键业务系统。

杨冰介绍,在专有云领域,OceanBase 已实现从头部金融核心系统到中腰部金融机构的规模化复制,目前已服务全部政策性银行、5/6 国有大行,资产规模万亿以上银行客户超 20 家、千亿以上银行客户近 100 家,及 70% 头部保险、75% 头部证券、50% 头部基金公司。(*头部为TOP 20)

在下午的攻坚关键业务系统实践专场,中国太平洋保险数智研究院首席数据库专家林春、北京银行软件开发中心平台架构研发团队主管王子健、北京农商银行运行维护中心总经理王文志、稠州银行数据架构师赵忆痕、国泰君安证券资深数据库专家尚留金、阳光数智科技技术创新孵化产品团队负责人杨清华、河南移动高级专家彭庆军作为专有云客户代表分享了 OceanBase 在各自企业的攻坚关键业务系统的实践。

(二) 公有云:OB Cloud 简化技术栈,助力千行百业

2022 年,OceanBase 推出云数据库 OB Cloud,启动云数据库战略。作为一体化云数据库产品,OB Cloud 大大简化企业技术栈,与此同时,其采用的多云原生架构支持多基础设施,进一步提升了云上资源利用率和云上系统的稳健性与可用性。

目前,公有云业务已成为 OceanBase 的第二条增长曲线,在全球范围内提供一致的云数据库服务,OB Cloud 现已服务超过 700 家客户,客户数年同比增长 130%,尤其受到零售、制造、互金行业的青睐,成为包括小米、理想汽车、vivo、宝洁、海底捞、滴滴出行、携程等高增长公司的共同选择,诸多海外电子钱包如 DANA、GCash、PalmPay 等也都采用了 OB Cloud。2 年来,逐渐沉淀了传统数据库上云、高并发、HTAP 实时分析、多模一体化和多云容灾 5 个场景。

在下午的云和 AI 时代的数据库实践专场,小米集团数据库专家崔春华、伯俊科技 CTO 陈雨陆、万家数科数据库专家马琳、海尔消金高级数据库架构师李兆、携程高级开发经理高帅锋、百词斩 CTO 敬宓六位客户代表围绕 OB Cloud 简化技术栈降本增效应用实践进行了精彩的分享。

(三)持续升级珊瑚计划,构建以合作伙伴为中心的商业生态圈

过去一年,OceanBase 进一步升级珊瑚计划,让伙伴在前、OceanBase 在后,持续构建以"合作伙伴"为中心的商业生态。2024 年,OceanBase 的行业解决方案伙伴数增长 100%,热门解决方案规模化落地数增加 50%,伙伴签约占比达到 70%,由核心经销商伙伴带来的业绩贡献占比达 60%,由技术服务伙伴独立交付的项目占比超过 30%。

在专有云领域,联合行业 ISV 打磨优秀的联合解决方案,持续攻坚关键业务系统,明年计划将伙伴独立交付项目占比提升至 50%。在公有云领域,构建公有云专家六大技术服务体系,实现每一个客户都有专属服务经理,同时实现全年 7×24 小时 5 分钟极速响应服务,确保服务可用性 SLA 达到 99.99%。

杨冰表示:OceanBase 的生态建设正在进入全新阶段,2025 年将继续深耕国内、共拓海外,坚持"被集成"战略,进一步加大攻坚关键业务系统、传统数据库上云和出海的生态激励,助力伙伴商业与能力双提升,携手业务开拓增长。

(四)开源开放,多维推动数据库内核关键人才体系

自 2021 年开源以来,OceanBase 同样在致力成为一个受开发者认可的开源数据库。2024 年,OceanBase 开放内核运维接口,参与国际开源项目合作,链接上下游 800 多款工具。截止目前已有 1000 多用户将 OceanBase 社区版用于实际生产系统,深入落地高并发、分库分表、实时数仓等核心系统场景,集群数突破 25000。

在晚间的开源交流会上,OceanBase 开源生态技术部总经理封仲淹表达了对每一位用户的感谢,OceanBase 会持续拥抱开源,为开发者带来更好的体验。来自贝壳计算存储方向容器引擎团队负责人王天庆、陌陌 DBA 团队负责人冀浩东、快手数据库研发工程师梁盼作为开源用户代表与会畅谈了自己于开源从上手到进入生产实践的过程,进一步展示了 OceanBase 社区版正在被越来越多用户信任。

此外,在数据库内核关键人才培养方面,目前 OceanBase 已有超 4 万名数据库人才完成认证,累计数据库专家超 1500 名;与此同时,连续举办 4 届面向高校的 OceanBase 数据库大赛,已吸引海内外 3500 多支队伍的 6500 余人参加。

2、一体化产品再升级,打造 AI 时代的数据底座

(一)面向关键业务负载,OceanBase 4.2.5 LTS 发布

OceanBase 最新发布的 4.2.5 LTS 版本是面向关键业务负载的全新长期支持版本,性能、稳定性和易用性方面都有显著提升。相较 4.2.1 LTS 版本,Sysbench 基准测试中读写性能提升 26%,批量写入性能提升 54%,进一步增强了 OceanBase 在关键业务场景下的性能能力。

在性能优化和优化器能力方面,4.2.5 版本引入了自适应链接和基线优先的 SPM 演进,通过分区表的晚期物化功能,优化了复杂查询处理能力。同时,优化器性能大幅提升,特别是在估行系统优化、DAS 路径选择改进、以及 CTE 抽取和 INLINE 代价验证等方面。此外,存储层引入了 Batch DML 批量接口,进一步提升了 DML 操作的效率,适用于多种业务场景。

在兼容性方面,4.2.5 版本针对 MySQL 兼容性,新增了租户对锁函数、非法日期、XA 事务和中间快速加列的支持,进一步确保 MySQL 业务平滑迁移的无缝体验。同时针对 Oracle 兼容性,租户层面新增了DBMS_LOCK 包功能,并支持快速删列和存储过程远程调用的复杂类型,进一步加强关键业务系统对兼容性的能力。

在系统的稳定性和可靠性方面同样获得了增强,4.2.5 版本新增了备份配置项功能,提升了数据备份的灵活性和可控性。通过日志强管归档、Transfer 活跃事务搬迁、以及基于 IO 负载的自适应仲裁升降级功能,提升系统在复杂业务场景下的容错能力和稳定性。、

在资源隔离与升级性能方面,4.2.5 版本优化了资源隔离机制,如将统计信息和Clog日志提交纳入资源隔离,并实现了 DDL 资源隔离,使多租户环境下资源分配更为合理。在多租户升级场景下,表级恢复和升级性能也得到优化,显著缩短了大规模租户的升级耗时,升级过程更加顺畅。

在安全性与易用性提升上,新版本通过 assume role 提升了对象存储访问的安全性,并新增了行锁等待和重试等待事件的诊断功能、响应时间直方图和日志传输链路视图,大幅提升了系统的可观测性和诊断效率。同时,Observer资源规格的动态修改实时生效,以及日志副本并行迁移优化,使DBA的管理操作更加便捷。

此外,OceanBase 4.2.5 扩展了其多模能力,新增了对 OBKV-Redis 模型的支持,进一步丰富了其生态系统。通过优化 ObHbase 的过期删除机制,解决了"热 key"场景下数据版本过多的问题,并新增了 ColumnPaginationFilter 和 Reverse Scan 接口,进一步提升了 HBase 兼容性。

总结来看,OceanBase 4.2.5 LTS 版本通过一系列技术和功能优化,巩固了其在关键业务场景中的稳定性、性能和兼容性,同时大幅提升了用户的管理体验和易用性。

(二)面向实时 AP 场景,OceanBase 4.3.3 正式 GA

在发布会上,OceanBase 推出面向实时 AP 场景的首个 GA 版本 4.3.3 。杨传辉介绍,4.3.3 版本在向量融合查询的关键能力上取得显著突破。针对 AP 场景进行大幅性能优化,推出全新向量检索功能,实现 SQL+AI一体化,深度融合 AI 与数据库处理,进一步满足客户在云+AI 时代的数据管理需求,加速 RAG、智能推荐、多模态搜索等业务场景的落地。

在对多模态数据的支持层面,4.3.3 版本进一步扩展了对复杂数据类型的处理能力,新增 Array 类型,并对 Roaringbitmap 类型数据的计算性能进行了优化,为企业处理多样化数据结构提供更高的灵活性。

在向量融合查询能力上,4.3.3 版本新增向量检索能力,支持向量数据类型和向量索引,并基于向量索引提供强大的搜索能力。用户可通过 SQL 及 Python SDK 等方式灵活调用 OceanBase 的向量检索能力,同时结合对海量数据的分布式存储能力、多模数据类型及多类型索引的支持,极大简化 AI 应用技术栈,助力企业高效构建 AI 应用。

在多工作负载方面,4.3.3 版本对 AP(分析处理)场景进行大幅性能优化,尤其是在海量数据分析时,能够提供更短的响应时间和更高的吞吐能力。同时引入了列存副本的新形态,实现满足 TP 和 AP 负载的物理资源强隔离,确保系统在处理事务型负载时,不受分析型负载的影响,特别是在实时数据分析和决策场景中,能够保持系统的高性能与稳定性。

与此同时在发布会上,OceanBase 与蚂蚁集团联合开发的向量库在业内标准的 ANN Benchmarks 基准测试中,针对 GIST-960 数据集表现出色。现场测试结果显示,该向量库性能远超其他算法,排名第一。特别是在 90% 以上的召回率区间,查询性能(QPS)相比此前最优算法 glass 提升 100%,相比基线算法 hnswlib 提升 300%。

(三)一体化数据库,打造 AI 时代的数据底座

随着 AI 技术发展,越来越多的 AI 应用不再局限于纯文本来生成回答,涉及的数据类型日益复杂,并且常存储于 IT 架构的不同数据库中,这对数据库提出了新的要求,包括提升性能与响应速度,要求数据库处理和存储不同类型的数据,并支持结构化、半结构化及非结构化数据的复杂融合查询。

杨冰表示:"伴随着互联网/移动互联网时代向 AI 时代演进,数据库也正从分散走向统一,一体化数据库将成为 AI 时代的数据底座。如何通过一个统一的数据库来处理所有类型的数据,并通过向量融合查询能力,让小团队也可以快速构建 AI 应用,是 OceanBase 一体化产品战略在 AI 时代的核心思考。"

会上,杨冰现场演示了"望小京"AI Agent Demo,请"望小京"推荐两公里内评分4.5以上、人均消费25元以内干净卫生的奶茶店。他介绍,这一Demo以OceanBase为数据底座,管理和处理结构化、半结构化以及非结构化数据,完成空间查询、关系过滤、向量计算等工作,为 AI 实时查询提供支持。

"以往构建一个复杂的 AI 应用,需要依赖多个不同的数据库、管理非常复杂的技术栈,同时还需要一个经验丰富且规模较大的团队。"他介绍,正是因为 OceanBase 具备一体化能力,才得以通过一个数据库高效处理所有查询、并通过极简架构就可以完成数据管理和 AI 应用开发。以 OceanBase 为底座的"望小京"仅依靠几位工程师、用一周时间就开发完成。

未来,OceanBase 将成为蚂蚁集团 AI 数据新底座,支持 AI 生活管家"支小宝"、AI 金融管家"蚂小财"、AI 健康管家三大 AI 应用,及支付宝百宝箱智能体开发平台的数据管理。杨传辉表示:AI 天然拥抱云,OceanBase 作为一体化数据库,不仅具备云上云下一体化能力,同时具备多云原生开放架构,这些优势都能有效地帮助客户实现云与 AI 结合,满足客户在云+AI 时代的数据管理需求,期待未来 OceanBase 可以应用在更多云和 AI 场景。

3、感谢大家,明年再见!

正如 OceanBase 创始人&首席科学家阳振坤在年度发布会的思考:"云是这个时代的主旋律,之所以云得到巨大发展,是因为它天生具有的便捷、易用性,可通过资源池化、复用降低企业成本,可以说在今天的数据库领域,云仍然有很大的发展空间"。

目前,OceanBase 的客户数已突破 2000+ ,生态建设正在进入全新阶段,正是每一位客户的攻坚实践,使 OceanBase 在众多真实场景中不断打磨,持续演进一体化产品能力,期待与更多客户携手并肩,共同攻坚关键业务负载,构建现代数据架构!

最后,感谢所有客户的信任,伙伴的支持,感谢今天在线下和线上,参会和关注我们的所有朋友,我们明年再见!后续我们会将发布会的演讲稿和一些精彩瞬间整理发布,敬请OceanBase官网

相关推荐
希忘auto3 小时前
详解Redis的常用命令
redis·1024程序员节
yaosheng_VALVE19 小时前
探究全金属硬密封蝶阀的奥秘-耀圣控制
运维·eclipse·自动化·pyqt·1024程序员节
dami_king19 小时前
SSH特性|组成|SSH是什么?
运维·ssh·1024程序员节
OceanBase数据库官方博客2 天前
半连接转内连接 | OceanBase SQL 查询改写
sql·oceanbase·分布式数据库
OceanBase数据库官方博客2 天前
解析在OceanBase创建分区的常见问题|OceanBase 用户问题精粹
oceanbase·分布式数据库·分区
OceanBase数据库官方博客2 天前
半连接转内连接规则的原理与代码解析 |OceanBase查询优化
sql·oceanbase·分布式数据库
IT培训中心-竺老师5 天前
OceanBase 数据库分布式与集中式 能力
数据库·分布式·oceanbase
靖顺5 天前
【OceanBase 诊断调优】—— OceanBase 数据库网络速率配置方案
网络·数据库·oceanbase
一个通信老学姐6 天前
专业125+总分400+南京理工大学818考研经验南理工电子信息与通信工程,真题,大纲,参考书。
考研·信息与通信·信号处理·1024程序员节
sheng12345678rui6 天前
mfc140.dll文件缺失的修复方法分享,全面分析mfc140.dll的几种解决方法
游戏·电脑·dll文件·dll修复工具·1024程序员节