2024 GIAC 全球互联网架构大会:拓数派向量数据库 PieCloudVector 架构设计与案例实践

5月24-25日,msup 和高可用架构联合举办了第11届 GIAC 全球互联网架构大会。会议聚焦"共话AI技术的最新进展、架构实践和未来趋势"主题,邀请了 100 余位行业内的领军人物和革新者,分享"Agent/RAG 技术、云原生、基座大模型"等多个热门技术领域的案例实践。

在本次大会中,拓数派向量数据库负责人邱培峰受邀参与并在『Agent技术/RAG技术』分会场发表了《大模型时代下向量数据库的设计与应用》主题演讲,详细介绍了云原生向量数据库 PieCloudVector 的设计与实践。

PieCloudVector 是拓数派旗下大模型数据计算系统 PieDataCS 的第二款数据计算引擎。除 PieCloudVector,PieDataCS 目前还支持云原生虚拟数仓 PieCloudDB Database,机器学习引擎 PieCloudML 两款计算引擎。

向量数据库作为一种新型数据库,因其高效的数据存储和检索能力,已经成为大模型时代的关键技术之一。向量数据库主要分为两种技术流派:一派是以向量搜索算法为基础,围绕其核心算法补充配套功能;另一派则是以传统关系型数据库为基础,通过扩展提供通过 sql 语句搜索向量的功能。而拓数派在设计 PieCloudVector 时,充分考虑两个方向的优劣势,将 Faiss 算法库作为向量搜索引擎,并与自研的关系型数据库对接起来,既提高了向量检索的性能,同时具备处理通用数据的能力。

拓数派打造的云原生向量数据库 PieCloudVector 支持多种索引类型和主流检索算法(IVF、HNSW等),并对 Faiss OpenMP 线程进行大量改造,避免无效线程,大幅提升 QPS,降低内存占用。此外,PieCloudVector 可兼容国产软硬件环境,并通过了信通院认证测试,满足自主可控的要求。

拓数派向量数据库负责人邱培峰

PieCloudVector 是大模型时代的分析型数据库升维,助力多模态大模型 AI 应用,支持和配合大模型的 Embeddings,帮助基础模型在场景 AI 的快速适配和二次开发。目前 PieCloudVector 已经帮助东吴证券秀财 GPT 构建了 AIGC 应用平台。

邱培峰被颁发GIAC合作讲师奖杯

未来,拓数派将持续改进 PieCloudVector 的存储、索引和检索能力,致力于与不同领域的应用场景相结合,并将逐步扩展支持多模态数据的处理和分析能力,提供更全面、灵活的解决方案。

PPT下载地址

相关推荐
该昵称用户已存在15 分钟前
数智园区・能碳协同:MyEMS 开源能源管理系统的场景化架构
架构·开源·能源
0xDevNull17 分钟前
Tomcat 运行原理与架构深度解析
java·架构·tomcat
混迹中的咸鱼19 分钟前
Unreal Engine 5 联机网络架构技术手册
网络·架构·ue5
Giggle121821 分钟前
上门家政服务平台 | 多端协同,源码交付,用户端小程序+H5、服务端APP、管理后台
java·小程序·架构·产品运营·个人开发
哥本哈士奇(aspnetx)8 小时前
Neo4j笔记(五):查询的处理流程
大模型
不懂的浪漫12 小时前
Netty 系列文章总览:从源码主线到业务架构判断
架构·netty
handsomestWei12 小时前
OpenAI 与 Anthropic 接口协议差异简述
大模型·llm·openai·模型接口
夜雨深秋来14 小时前
多租户 AI Agent 平台架构设计与实践
架构·langchain·agent
却尘17 小时前
让 AI 不再写到一半就开始"编":SDD + OpenSpec 上手指南
架构
梦梦代码精18 小时前
LikeShop 二次开发扩展能力白皮书——面向业务增长的可扩展电商架构实践
java·架构·github