过去三十年,数据库世界被一条清晰的界线分隔开来。一边是用于日常交易的关系型数据库,处理订单、用户登录、库存更新。另一边是用于分析的数据仓库和数据湖,处理销售报表、用户画像、趋势预测。两者之间,隔着一条由ETL管道、数据复制、延迟和成本构成的鸿沟。
这条鸿沟存在的原因很简单:两种系统的设计目标完全不同。OLTP数据库针对单行快速读写优化,OLAP系统针对大规模扫描和聚合优化。它们用不同的存储格式,不同的查询引擎,不同的扩展策略。企业不得不同时维护两套系统,两套团队,两条数据流水线。
然而,AI时代正在瓦解这条界线。AI应用既需要实时读写事务数据,又需要大规模分析历史数据。一个智能客服需要读取订单状态,同时分析用户行为模式。一个推荐引擎需要记录用户点击,同时扫描数亿条历史记录来训练模型。传统架构下,这两种需求被分到不同的系统,中间需要复杂的CDC管道来搬运数据。
Lakebase正是为了解决这个问题而生的新范式。它试图在同一个平台上,同时满足OLTP和OLAP的需求。本文将从技术演进、架构设计、行业趋势三个维度,系统分析Lakebase为什么是数据库发展的必然方向,以及它对企业和开发者意味着什么。
说明:Lakebase存在多种技术实现。Databricks将Lakebase定义为基于存算分离架构的托管Postgres数据库,阿里云PolarDB也发布了同名的AI数据湖库方案。本文主要基于Databricks的Lakebase技术栈展开分析。
一、传统数据库架构的三重困境
1.1 存算一体架构的硬边界
传统Postgres等OLTP数据库采用存算一体架构。计算和存储绑定在同一节点上,数据库的容量和吞吐量受限于单台服务器的磁盘大小和IO能力。
这种架构带来了几个根本性限制。首先,扩容需要迁移大量数据,耗时数小时甚至数天,期间服务可能中断。其次,高可用依赖复制,需要维护多份完整的数据副本,成本和复杂性都很高。第三,计算和存储资源必须同步扩展,无法独立优化,往往导致资源浪费或瓶颈。
存算一体的另一个代价是开发体验的退化。传统数据库中没有"git checkout -b"这样的分支操作。开发、测试、生产环境的数据库需要各自独立部署和填充数据,成为软件开发周期中最容易出错的部分。
1.2 事务与分析系统的割裂
在传统架构中,事务数据库与分析系统完全隔离。数据从OLTP系统搬到OLAP系统需要定制ETL管道、手动管理schema、分别维护访问控制。这种割裂拖慢了开发速度,增加了运维负担。
CDC管道是这种割裂的典型体现。为了将运营数据同步到分析系统,团队需要配置数据库连接器、监控复制状态、处理性能影响,并通过不连贯的工具追踪错误。在AI智能体开发时代,这种模式难以持续。快速数据分支需要为每个新分支维护复杂的抽取管道,成本不可控。
Futurum Group的调研显示,73.6%的组织计划增加分析数据平台的投入,44%的数据领导者将数据容量和复杂性的增长列为主要驱动因素,40%表示需要新功能。市场的焦虑已经清晰地指明了方向:旧架构撑不住了。
1.3 AI时代的新需求
AI应用对数据基础设施提出了三个传统数据库无法满足的新要求。
实时性与历史性的统一是首要挑战。AI应用既需要毫秒级的事务响应,又需要秒级的海量历史数据分析。传统方案中,这两个需求被分配给不同的系统,数据在系统间移动时产生延迟和不一致。
开发和实验速度是另一个瓶颈。AI开发本质上是实验性的。开发者需要频繁测试不同的数据模型、不同的分支策略。传统数据库中,创建测试环境需要复制整个数据库,成本高、速度慢。而AI智能体更需要在隔离环境中安全地执行操作,然后快速回滚。
最后是成本结构的问题。传统数据库按峰值负载预置资源,闲时资源大量浪费。对AI应用而言,工作负载的波动性更大,按固定规格付费的模式更加不经济。
二、Lakebase的架构创新
2.1 存算分离
Lakebase的核心创新是存算分离。计算层和存储层解耦,各自独立扩展。
在存算分离架构下,数据持久存储在对象存储中,计算实例在需要时动态创建和销毁。这种设计带来了几个关键能力。
独立扩展成为可能。计算资源可以根据负载自动扩缩,从零到数千并发,而存储独立增长。不再需要为偶尔的峰值负载购买固定规格的硬件。
高可用成本大幅降低。因为存储本身就是高可用的,计算故障不会导致数据丢失。故障恢复只需要启动新的计算实例,连接到现有存储即可,无需数据迁移。
2.2 即时分支
Lakebase最引人注目的特性是即时分支。基于写时复制技术,可以在几秒钟内创建数据库的完整副本,包括schema和数据,而不复制底层存储。
分支的工作原理是父子层级结构。每个分支都有一个父分支。创建分支时,子分支通过指针共享父分支的存储。只有当数据被修改时,才写入新数据。
这种设计意味着:创建分支的时间与数据库大小无关,100GB或100TB的数据库分支都在瞬间完成;存储成本只取决于实际变化的数据量,创建100个分支不会产生100倍的存储费用;分支对生产工作负载没有任何性能影响。
分支的实际应用场景非常广泛。开发人员可以为每个功能分支创建独立的数据库分支,在隔离环境中测试schema变更。AI智能体可以在分支上安全地实验,验证结果后再合并到主分支。CI/CD流程可以在每次构建时自动创建临时分支,测试完成后自动删除。
分支还支持时间点恢复。用户可以从父分支历史中的任意时间点创建新分支,用于数据恢复、审计或历史分析。恢复窗口最长可达35天。
2.3 湖库一体:终结ETL管道
Lakebase的另一个关键特性是与数据湖的深度集成。运营数据不再孤立于分析平台之外,而是通过同步表直接暴露给Lakehouse引擎。
同步表将Lakebase中的表自动镜像到Unity Catalog托管的Delta表中。下游的Spark引擎、SQL仓库、AI智能体可以直接查询这些表,无需额外的ETL或反向ETL流程。
变更数据流进一步扩展了这个能力。开启CDF后,所有表的变更以统一目录托管表的形式暴露出来。任何引擎、模型或智能体都可以直接从同一份数据流中读取,完全隔离于主运营工作负载。这使运营数据库成为多层级架构中的原生铜层,实现端到端的统一治理和血缘追踪。
2.4 为AI智能体而设计
Databricks的数据显示,在过去一年中,由AI智能体创建的数据库占比从30%增长到超过80%,AI智能体创建数据库的速度是人类的4倍。Lakebase的几个特性使其特别适合AI智能体场景。
开源生态兼容性是首要优势。所有前沿大语言模型都在Postgres生态的海量公开信息上训练过,AI智能体天然熟悉Postgres。开发者不需要教AI如何使用数据库,它已经会了。
快速弹性是关键能力。AI智能体以机器速度运行,按需创建和销毁数据库环境。Lakebase的秒级启动和缩放到零能力,使为每个智能体分配独立数据库成为经济可行的方案。
分支隔离为智能体提供了安全的实验环境。AI智能体可以在分支上自由操作,验证vibe,确认结果后再合并。不必担心非确定性行为污染生产数据。
2.5 与Databricks Apps的深度集成
Lakebase与Databricks Apps的集成进一步降低了全栈应用开发的门槛。开发者在同一个平台上就能完成从数据工程到应用交付的全链路工作,无需在多个系统间切换。
典型的工作流程是:在Databricks工作空间中创建Lakebase实例,通过Databricks Apps构建应用前端,使用Databricks SDK和SQLAlchemy安全地读写Lakebase。整个过程中,身份认证、访问控制、网络配置都由平台统一管理,无需手动配置。
三、行业趋势与竞争格局
3.1 多个玩家的差异化路径
Lakebase并非Databricks独有的概念。阿里云PolarDB在2026年1月也发布了Lakebase解决方案,定位为"湖库一体"架构,融合数据湖的灵活性与数据仓库的高性能。阿里云数据库负责人李飞飞明确指出:"AI原生数据库是技术演进的必然方向"。
不同厂商对Lakebase的实现路径存在差异。Databricks的Lakebase基于Postgres和Neon的分支技术,强调与Lakehouse的深度集成。阿里云PolarDB的Lakebase则更侧重多模态数据管理和库内推理能力。
PlanetScale的基准测试提供了另一个视角。测试显示,在TPCC场景中,PlanetScale在32连接下的QPS约为18000,而Neon/Lakebase约为12500。PlanetScale的p99延迟也显著更低。PlanetScale的M-320配置月费为1349美元,而Neon/Lakebase的8CU配置月费约1471美元。这表明Lakebase在性能和成本上仍在快速迭代中。
3.2 对传统数据库厂商的冲击
Futurum Group的分析指出,Lakebase和LTAP构成了对传统数据库范式的结构性突破,正在迫使买方和既有厂商重新审视关于持久性、扩展性和成本的核心假设。
传统单体数据库将持久性、扩展性和工作负载隔离绑定在单机的磁盘上,往往导致昂贵的副本、脆弱的高可用和性能瓶颈。Lakebase的存算分离架构直接挑战这一模式。其外部化存储的设计消除了单节点持久性风险,减少了对昂贵只读副本的依赖,并支持即时分支用于开发和高可用。
Oracle、Microsoft、Snowflake等既有厂商不会轻易退让,各自在负载统一和高可用方向上都有深厚积累。Databricks需要证明其无状态、存储中心的设计能够满足企业对可用性、合规性和运维简单性的企业级标准。
3.3 技术演进的核心驱动力
Lakebase的出现不是偶然的,它是以下技术趋势交汇的产物。
硬件层面,对象存储的普及使廉价、高持久性的存储成为基础设施的一部分,不再需要依赖昂贵的本地SSD来保证数据可靠性。
AI工作负载的独特性是另一个驱动力。AI应用是实验性的、并发的、波动的,需要比传统OLTP系统更高的弹性和更低的试错成本。
开发者体验的工业化需求同样重要。现代开发流程要求数据库能够像代码一样被版本化、分支化和自动化测试,传统数据库无法满足。
四、Lakebase的挑战与边界
4.1 性能与延迟的权衡
存算分离并非没有代价。计算和存储分离意味着每次查询都需要通过网络访问对象存储,这会增加延迟。虽然通过缓存层和预预热实例可以缓解,但与本地SSD相比仍有差距。
PlanetScale的基准测试显示,在某些OLTP场景中,传统架构的延迟和一致性表现仍优于Lakebase方案。这意味着Lakebase更适合延迟容忍度较高或需要弹性扩展的场景,而非所有OLTP工作负载都适合迁移。
4.2 企业级成熟度
Lakebase仍在快速演进中。目前存在Provisioned和Autoscaling两个版本,功能存在差异。Autoscaling版本支持自动扩缩、缩放到零、分支和即时恢复,而Provisioned版本需要手动管理扩展。
合规性支持也在逐步完善中。Lakebase Autoscaling目前仅支持HIPAA、C5、TISAX等部分合规标准,其他标准尚不支持。
4.3 生态系统依赖
Lakebase紧密绑定在Databricks生态中。对已使用Databricks平台的用户来说,这是天然优势。但对不在Databricks生态中的企业,引入Lakebase意味着对平台选择的某种锁定。
与此相对,阿里云PolarDB的Lakebase解决方案则绑定在阿里云生态中。企业在选择时需要考虑自身的云战略和生态偏好。
五、结论:数据库架构的范式转移已经开始
Lakebase代表了一种根本性的架构转向:从为单一工作负载优化的专用数据库,走向为统一数据访问设计的开放平台。
这一转向由AI驱动。AI应用需要同时访问事务数据和分析数据,需要在隔离环境中安全地实验,需要按需弹性地扩展。传统数据库架构无法满足这些需求,而Lakebase提供了新的可能性。
存算分离、即时分支、湖库一体,这些能力不是锦上添花的功能,而是应对AI时代数据挑战的基础设施。它们改变了数据库的运维模式、开发流程和成本结构。
当然,Lakebase仍在演进中。性能和成熟度的提升需要时间,生态系统的建设需要持续投入。但方向已经明确:数据库的下一站,是将事务、分析和AI统一在同一平台上的开放架构。
正如阿里云李飞飞所说:"AI原生数据库是技术演进的必然方向"。Lakebase正是这一方向上的重要里程碑。