2024 GIAC 全球互联网架构大会:拓数派向量数据库 PieCloudVector 架构设计与案例实践

5月24-25日,msup 和高可用架构联合举办了第11届 GIAC 全球互联网架构大会。会议聚焦"共话AI技术的最新进展、架构实践和未来趋势"主题,邀请了 100 余位行业内的领军人物和革新者,分享"Agent/RAG 技术、云原生、基座大模型"等多个热门技术领域的案例实践。

在本次大会中,拓数派向量数据库负责人邱培峰受邀参与并在『Agent技术/RAG技术』分会场发表了《大模型时代下向量数据库的设计与应用》主题演讲,详细介绍了云原生向量数据库 PieCloudVector 的设计与实践。

PieCloudVector 是拓数派旗下大模型数据计算系统 PieDataCS 的第二款数据计算引擎。除 PieCloudVector,PieDataCS 目前还支持云原生虚拟数仓 PieCloudDB Database,机器学习引擎 PieCloudML 两款计算引擎。

向量数据库作为一种新型数据库,因其高效的数据存储和检索能力,已经成为大模型时代的关键技术之一。向量数据库主要分为两种技术流派:一派是以向量搜索算法为基础,围绕其核心算法补充配套功能;另一派则是以传统关系型数据库为基础,通过扩展提供通过 sql 语句搜索向量的功能。而拓数派在设计 PieCloudVector 时,充分考虑两个方向的优劣势,将 Faiss 算法库作为向量搜索引擎,并与自研的关系型数据库对接起来,既提高了向量检索的性能,同时具备处理通用数据的能力。

拓数派打造的云原生向量数据库 PieCloudVector 支持多种索引类型和主流检索算法(IVF、HNSW等),并对 Faiss OpenMP 线程进行大量改造,避免无效线程,大幅提升 QPS,降低内存占用。此外,PieCloudVector 可兼容国产软硬件环境,并通过了信通院认证测试,满足自主可控的要求。

拓数派向量数据库负责人邱培峰

PieCloudVector 是大模型时代的分析型数据库升维,助力多模态大模型 AI 应用,支持和配合大模型的 Embeddings,帮助基础模型在场景 AI 的快速适配和二次开发。目前 PieCloudVector 已经帮助东吴证券秀财 GPT 构建了 AIGC 应用平台。

邱培峰被颁发GIAC合作讲师奖杯

未来,拓数派将持续改进 PieCloudVector 的存储、索引和检索能力,致力于与不同领域的应用场景相结合,并将逐步扩展支持多模态数据的处理和分析能力,提供更全面、灵活的解决方案。

PPT下载地址

相关推荐
qq_1674015134 分钟前
使用 dash 构建整洁架构应用
架构·dash
绝无仅有1 小时前
某多多大厂面试相关计算机网络知识点总结
后端·面试·架构
绝无仅有1 小时前
调用服务出现网络错误的问题排查与解决
后端·面试·架构
存在morning11 小时前
【人工智能学习笔记 三】 AI教学之前端跨栈一:React整体分层架构
笔记·学习·架构
哥本哈士奇(aspnetx)12 小时前
实现AI和BI整合的初步思路和探索
大模型
canonical_entropy12 小时前
最小信息表达:从误解到深层理解的五个关键点
后端·架构
少林码僧15 小时前
2.3 Transformer 变体与扩展:BERT、GPT 与多模态模型
人工智能·gpt·ai·大模型·bert·transformer·1024程序员节
蚂小蚁16 小时前
一文吃透:宏任务、微任务、事件循环、浏览器渲染、Vue 批处理与 Node 差异(含性能优化)
前端·面试·架构
吃饺子不吃馅16 小时前
前端画布类型编辑器项目,历史记录技术方案调研
前端·架构·github