今年的 AI 热潮给数据基础设施带来了巨大变革。大模型及生成式 AI 的落地,让金融、零售、制造、医疗等行业都在加速推进数据平台的智能化升级。与之对应,数据体量和复杂性不断提升,企业对数据库系统的性能、扩展性、多模融合与 AI 支持能力提出了更高要求。
8月2日,Databend Meetup·北京站线下活动聚焦"迈向 AI 驱动的数据平台",汇集了国内数据库领域多位一线专家:Databend 创始人兼 CEO 张雁飞、Databend 数据库研发工程师白珅、TiDB 社区架构师李仲舒、亚信科技数据产品线规划部架构师赵燕,以及来自各行各业的技术负责人、DBA、开发与运维工程师。参会嘉宾围绕"AI Ready 数据平台"的主题,共同探讨了大模型时代数据库和数据平台的创新演进与实战应用。

Databend Meetup·北京站嘉宾分享

Databend Meetup·北京站交流讨论
以下内容就将为您带来这些话题背后的深度思考:
Databend 技术演进之路:OLAP → LakeHouse → Data + AI 驱动的多模态数据库
张雁飞在主题为《Databend 技术演进之路:OLAP → LakeHouse → Data + AI 驱动的多模态数据库》的分享中,系统回顾了 Databend 从最初的 OLAP 云原生架构,到 Lakehouse 演进,再到如今 Data + AI 多模态融合的完整技术路线,并重点展示了 Databend 在支持 AI 场景下的核心创新。

Databend 创始人兼 CEO 张雁飞
云原生 OLAP ,存算分离架构
Databend 自2021年起便坚定投入 Rust 技术路线,拥抱对象存储与存算分离,实现弹性扩展与高可用,降低企业数据基础设施的运维和成本压力。核心底座基于对象存储和分布式调度,既满足大数据分析的高并发、低成本,又支持企业在云环境下灵活扩展。
Lakehouse 架构升级与多模态融合
随着客户对数据类型和实时性的要求提升,Databend 在 Lakehouse 架构基础上不断增强多模态能力。平台不仅支持结构化(表格)、半结构化(JSON/日志)、非结构化(文本、音视频、图片)等多类数据类型,还自研 JSONB 存储格式、自动索引与 Pipeline 工具,帮助企业轻松应对多源异构、批流一体、数据清洗等场景。用户无需堆叠多套数据库系统,就能高效处理复杂数据。
Data + AI 驱动的全新平台能力
Databend 针对 AI 应用场景持续演进,原生支持向量数据、全文检索、HNSW 等主流向量索引,内置 AI 函数,可便捷调用外部大模型服务,实现 SQL+AI 无缝协作。在游戏、推荐、知识问答等实际场景中,Databend 支持通过 SQL 直接驱动向量化与 AI 能力,大幅降低了智能应用门槛。平台强调三类数据(结构化、半结构化、非结构化)统一处理,为企业打造真正"AI Ready"的多模数据基座。
张雁飞强调,Databend 的整体设计理念,是根据客户需求和行业发展趋势,将结构化、半结构化和非结构化三类数据统一融合到一个平台架构中。无论数据类型如何变化,用户都可以通过统一的架构和标准化接口实现高效的数据存储、处理和智能分析,无需频繁更改底层架构。
这正是 Databend 能力不断进化和创新的根本动力所在!
Databend 向量索引:加速 AI 应用的数据引擎
白珅以《Databend 向量索引:加速 AI 应用的数据引擎》为主题,系统梳理了向量数据、向量检索与索引技术在 Databend 平台上的最新实践与技术挑战,并以具体案例直观展示了产品在 AI 时代的能力进展与不足。

Databend 数据库研发工程师白珅
向量数据的价值与应用场景
近年来,AI 和大模型的普及推动了向量数据的广泛应用。白珅首先介绍了向量数据如何承载文本、图像、音频等非结构化信息,通过 embedding 技术转化为数字向量,实现语义理解与智能检索。他以 Arxiv 论文检索为例,展示了如何基于 Databend 存储和检索超百万级论文向量,极大提升了搜索效率和准确性。
原生向量类型与性能优化
Databend 原生支持向量字段,并可灵活设置索引参数。白珅详细展示了向量表的表结构设计、批量导入数据、通过 UDF 自定义 embedding 函数实现文本向量化、利用索引加速相似度检索的完整流程。通过实际测试数据,他对比了无索引与 HNSW 向量索引的性能差异------检索速度提升达 6 倍,实际业务中能满足高并发低延迟的搜索需求。
向量索引原理与压缩技术
技术层面,白珅为大家深入讲解了 HNSW(分层可导航小世界图)索引的原理及参数调优方法,并介绍了标量量化、乘积量化等常见向量压缩技术在提升索引效率、降低存储消耗方面的实践。向量索引使大规模非结构化数据的近似检索成为可能,是现代推荐系统、智能搜索、知识问答等场景的核心支撑。
问题、挑战与未来方向
白珅坦言,目前向量数据库生态仍处于发展初期,Databend 在向量功能、工具链丰富度等方面与专业产品相比还有差距。例如,写入性能因索引同步存在牺牲、工具和运维生态仍需完善。未来团队将持续提升索引性能、丰富相关工具与文档,助力开发者更便捷地将 Databend 用于 AI 相关场景,实现结构化与非结构化数据的一体化管理与分析。
AI 时代,一栈式数据底座 TiDB 赋能企业数智化转型
TiDB 社区架构师李仲舒分享了《AI 时代,一栈式数据底座 TiDB 赋能企业数智化转型》,介绍了 TiDB 如何围绕云原生、HTAP、一栈式体验持续迭代,并积极适配 AI 场景和新型混合数据需求,助力企业实现业务数智化升级。

TiDB 社区架构师李仲舒
分布式 ****OLTP 到 HTAP 的全场景支持
TiDB 最初致力于通过分布式架构解决 MySQL 在高并发和大数据量下的扩展难题。随着客户需求升级,TiDB 引入 HTAP 能力,将 TP(在线事务处理)和 AP(分析处理)合二为一,一套 TiDB 即可满足企业交易、分析、实时报表等多样需求。产品形态涵盖敏捷模式、分布式云服务、企业级平台,支持 GB 到 PB 级数据弹性扩展。
助力业务 AI 一体化 :内核向量检索与智能助理
TiDB 积极布局 AI 场景,内核已支持向量索引(如 HNSW),适用于文本、图像、推荐等 AI 检索应用。同时推出开源 RAG(检索增强生成)生态工具,集成向量存储、知识图谱、结构化数据协同。团队实际验证过,TiDB 不仅能应对高并发交易,还能为智能问答、推荐、知识库等 AI 应用提供底层数据支撑。
多模场景协作,归档与实时分析 最佳实践
TiDB 与 Databend 的组合已在实际客户场景中成功落地。具体而言:TiDB 负责支撑前端高并发事务、业务数据归档、实时数据写入,Databend 则承接大数据归档、压缩、分析和多模查询。二者协同配合,为用户的大规模归档和复杂数据分析带来性能与性价比的双重提升。金融、互联网、制造业等场景下的高吞吐、动态数据分析,都能灵活设计归档解决方案,降低维护与架构复杂度。
李仲舒总结,TiDB 在"可靠弹性的一栈式平台+AI 数据能力"的驱动下,正成为企业出海与本土创新的底座选择,尤其契合多租户、弹性服务和数据全生命周期治理的需求。
数据平台向 AI Native 的演进
亚信科技数据产品线规划部架构师赵燕以《数据平台向 AI Native 的演进》为题,结合亚信多年平台建设与智能化落地实践,深度分析了数据平台智能化趋势、AI 原生平台能力与典型场景创新。

亚信科技数据产品线规划部架构师赵燕
数据平台的转型:从功能完善到价值运营
赵燕指出,随着AI和大数据技术的深入应用,数据平台建设已经从早期的"工具补齐"转变为聚焦降本增效、智能赋能和业务价值挖掘。亚信利用自然语言交互、智能数据助手等手段,简化数据开发、提升治理效率,把更多人力释放到创新应用和数据变现中。
AI Native 架构能力布局
亚信的数据技术平台具备多模数据采集、开发、治理与开放全流程能力,覆盖结构化、半结构化、非结构化(文档、音视频等)多种数据类型。平台突出 AI 数据助手、知识对话机器人、自动化 BI 工具,满足复杂场景下的数据融合、分析和共享。平台已在运营商、金融、能源、交通等头部行业大规模落地,沉淀了丰富的实践经验。
智能体 能力演进与行业案例
2025 年,亚信重点推进 Data + AI、Data for AI、AI for Data 的三大方向。团队已实现统一多模数据目录(Catalog)、自动数据清洗、智能体协作等一系列创新。实际案例包括智能体编排的客服与工单处理、自动化招标文档生成、Chat BI 经营分析、保险行业数字助理等,帮助企业提升了数据治理、开发和业务决策效率。
赵燕表示,AI Native 数据平台的落地不是一蹴而就,而是技术、流程和团队共同演进的结果。亚信希望通过平台化、模块化和行业化持续推动数据智能转型。
数据库行业正在从基础功能比拼,走向生态、智能化和场景价值的深度融合。AI Ready 不只是口号,更是每个团队持续打磨的产品能力和服务能力。Databend Meetup·北京站所展现的,正是这一代数据平台技术人与企业共同探索的脚踏实地、持续进步的真实写照。
未来,随着 AI、大模型和多模数据技术的进一步突破,行业仍有许多值得深耕的新课题。我们期待更多开发者、用户、合作伙伴加入到"AI Ready 数据平台"创新实践的行列,共同见证和推动智能数据基座的升级迭代。
关于 Databend
Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式湖仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。
👨💻 Databend Cloud:databend.cn
📖 Databend 文档:docs.databend.cn
💻 Wechat:Databend
✨ GitHub:github.com/databendlab...