OceanBase 开发者大会,拥抱 Data*AI 战略,构建 AI 数据底座

5 月 17 号以"当 SQL 遇见 AI"为主题的 OceanBase 开发者大会在广州举行,因为行程的原因未能现场参会,仍然通过视频直播观看了全部的演讲。总体来说,这届大会既有对未来数据库演进方向的展望,也有 OceanBase 新产品的发布,还有当前行业用户使用 OceanBase 数据库的经验分享,可谓是干货满满。

全面拥抱 Data*AI 战略

2025 年可以说是 AI 元年,各大厂商都在积极的将自己的产品纳入到 AI 框架中,OceanBase 也不例外。蚂蚁金服 CTO 何征宇在演讲中指出,AI 的本质仍然是数据,决定了智能的上限。然而当前获取数据的成本越来越高、行业数据流通难、多模态数据处理难以及数据质量评估难等几大问题,制约了 AI 在行业中的落地和推广应用。

OceanBase 的 Data*AI 战略,致力于打造一个数据底座,通过一套架构同时支持 TP/AP/AI 混合负载,既支持向量检索,又能实现 SQL 与 AI 的混合检索,实现数据与模型的深度一体化融合。

积极拓展 AI 数据底座能力

说到 AI 总是离不开向量数据库,当大模型的数据无法触及到更专业更精准的领域时,将专业数据向量化保存到数据库中,是大模型最好的补充。OceanBase 向量数据库经过多个版本的迭代,其处理性能已经超过业界主流开源向量数据库。

和 Data*AI 战略相呼应,本次大会上正式发布 OceanBase PowerRAG,打造面向 AI 时代开箱即用的 RAG 服务。PowerRAG 提供 Document(文档)和 Chat(对话)两个核心 API 接口,打通应用开发数据层、平台层、接口层与应用层的全流程,帮助用户实现文档知识库、智能对话、图像比对、数据分析等多种 AI 应用场景的快速开发。

传统能力持续增强

OceanBase 架构演进上有两个最重要的版本迭代,一是 2016 年 1.0 版本实现了所有节点的可读可写,另一个是 2020 年的 4.0 版本提出的单机分布式一体化架构,能够在一套系统中同时实现分布式的扩展性和单机性能。在夯实了高可用基础,实现稳定的性能之后,OceanBase 也在向更多的领域扩展。

  • 正式推出 OceanBase 企业级单机版,支持非核心的系统更轻量的使用 OceanBase 数据库;桌面版甚至能够在 2C6G 配置的笔记本上运行。相比于集群版动辄几十 G 的内存来说,单机版和桌面版大大降低用户的使用门槛;
  • 全新发布面向对象存储的"共享存储"产品形态,成为业界首个在 TP 场景下支持对象存储的多云原生数据库。成本角度看,在 TP 负载下,存储成本降低 50%;在 AP 负载下,存储成本最高可降低为原来的 1/10。相对于 Share Nothing,在计算节点扩容时不需要进行数据迁移,具有更快的速度和弹性;
  • OceanBase 4.3.5 也是首个面向 AP 场景功能完备的 LTS 版本。针对一系列 AP 数据库的能力进行了增强,如支持堆表组织表,适应 AP 中经常大批量数据导入而数据又无序的场景;增强了嵌套物化视图功能,满足数据加工和预处理的需求;未来还将持续和 Iceberg 等数据湖的集成,通过 OceanBase 访问外部数据会更加便利。

写在最后

经过 10 多年的发展,OceanBase 已经成为最流行的开源中国数据库之一,连续两年占据墨天轮国产数据库排行榜的首位。自 2021 年 6 月 1 号开源以来,已经有超过 1500 个企业用户选择使用 OceanBase,社区集群安装量已经超过 52000 套,而且这个趋势还在不断的加速中。

自笔者开始关注以来,OceanBase 在产品能力和市场拓展上取得了非常大的成就。 在 AI 元年 OceanBase 也适时推出了 Data*AI 的战略,相信在不久的将来也会看到 OceanBase 在 AI 领域更大的成功。

相关推荐
小鸡吃米…6 小时前
机器学习 - K - 中心聚类
人工智能·机器学习·聚类
好奇龙猫6 小时前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】
人工智能·学习
沈浩(种子思维作者)6 小时前
真的能精准医疗吗?癌症能提前发现吗?
人工智能·python·网络安全·健康医疗·量子计算
minhuan7 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51
人工智能·大模型参数评估·边际效益分析·大模型参数选择
Cherry的跨界思维7 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南
java·人工智能·vue3·ai测试·ai全栈·测试全栈·ai测试全栈
MM_MS7 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作
开发语言·人工智能·深度学习·算法·目标检测·计算机视觉·视觉检测
ASF1231415sd7 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】
人工智能·yolo·目标跟踪
水如烟8 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说
人工智能
Carl_奕然8 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试
人工智能·python·数据挖掘·数据分析
旅途中的宽~8 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法
人工智能·计算机视觉·mri·sci一区top·血管瘤·t1