如何做好RAG和向量搜索?从实战经验中获取解法

随着Chat GPT的流行,LLMs(大语言模型)再次进入人们的视野。但是在处理特定领域的查询时,大模型生成的内容存在信息滞后、不够准确等问题。此时,RAG(Retrieval-Augmented Generation)技术就像一个"外挂",通过结合外部知识库,动态地为 LLMs 提供信息,从而解决了模型训练数据静态和生成信息准确性的问题。向量搜索作为 RAG 的关键组成部分,利用高维数据的向量表示进行高效的相似性搜索,使得相关信息的检索更为精确和快速。

但是,进入到更深度的业务场景中,RAG 技术的应用面临着从文件解析、数据融合、索引创建、向量数据库,到混合检索和 rerank 等系列难题,向量搜索在耗时、召回精度、存储成本等方面也面临着挑战。如何让RAG和向量搜索技术落地时,更好地满足企业需求?如何在向量之上构建全链路 RAG 服务,提升开发者效率,降低成本?

为了深入探讨RAG和向量搜索技术的最新进展、实践案例以及未来趋势,Zilliz的合伙人和研发副总裁栾小凡 作为出品人,特别在6月28日至29日于北京富力万丽酒店举办的2024稀土开发者大会 上设置了 RAG 与向量搜索 分论坛。此次大会由稀土掘金技术社区主办,并得到英特尔的助力。

🔥🔥🔥 199元限量超值票火热售卖中!还有免费 AI展区&掘金动手实验室专属票! AI展区企业包含商汤,月之暗面,宇树(unitree)、Jina AI、科大讯飞、硅基流动、零一万物、Zilliz、扣子和字节cloud IDE等! 点击购票:conf.juejin.cn/xdc2024/?ut...

分会场议程

演讲嘉宾:郑钦月 LlamaIndex AI 研究员

华中科技大学学士,瑞士洛桑联邦理工(EPFL)硕士,曾赴哈佛大学交流学习。现任 LlamaIndex AI 研究员,专注 LlamaParse 文档解析,致力于 RAG 框架性能及外接信息质量提升。

演讲主题:从基础 RAG 到 Agent:LlamaIndex 助力大模型应用落地的思考与实践

本次分享将介绍LlamaIndex 框架为 RAG 开发者提供的工具和解决方案,探讨简易 RAG 的局限与挑战,分享 LlamaIndex 对未来 Agentic RAG 发展的思考与实践。

演讲大纲

  1. LlamaIndex 简介

  2. 简易 RAG 的局限与挑战

  3. Agentic RAG 概述 :在 2024 搭建一个 Agent 需要什么

  4. Agent 推理规划

  5. What's next?

演讲嘉宾:贾玮 蚂蚁集团资深技术专家

2016 年加入蚂蚁集团,专注于存储基础设施领域,负责蚂蚁在线存储系统的设计研发工作,目前是蚂蚁在线 KV 存储/内存存储和向量数据库的技术负责人,对计算存储基础设施、中间件、向量检索有一定实践经验。

演讲主题:蚂蚁在 RAG 与向量检索上的实践

分享蚂蚁集团在 RAG 与向量检索上的实践,一起探讨在向量检索耗时、召回精度,千亿向量存储成本等方面所面临的一系列挑战,并介绍蚂蚁集团在向量索引与存储结合上所做的一系列优化和工程实践。

演讲大纲

  1. RAG在蚂蚁的应用

    1.1 全网搜索

    1.2领域大模型

    1.3 场景总结

  2. 挑战

    2.1 超高召回精度

    2.2 延迟敏感场景

    2.3 千亿规模向量的存储挑战

  3. 向量索引与存储相关优化与工程实践

    3.1 向量距离计算优化

    3.2 Top1/TopK召回优化

    3.3 向量索引与存储工程优化实践

    3.4 开源规划

  4. 我们对向量数据库的发展预测

演讲嘉宾:卢向东 杭州萌嘉网络创始人 & CEO

十余年研发创新管理经验,五年 AI 产品线团队管理经验。曾创造并运营过千万级用户 AI 产品。国内最早宣传和研发 RAG 及相关技术的一批开发者之一。(公众号:土猛的员外)

演讲主题:RAG 在企业应用中落地的难点与创新分享

本次分享主要介绍 RAG 在企业落地中的难点,从文件解析、数据融合、索引创建和向量数据库,到混合检索和 rerank 中技术难题与解决方案分享。另外,还将分享基于 RAG 的三种企业创业应用,让 RAG 更贴近企业真实需求。

演讲大纲

  1. RAG 在企业中的难点

    1.1 难点1:文件解析,企业中常见的文件类型和要求

    1.2 难点2:结构化数据如何融合

    1.3 难点3:索引中提前处理的工作和向量数据库的应用

    1.4 难点4:检索和 rerank 中的难点和解决

  2. RAG 在企业应用中的创新

    2.1 创新1:RAG 在金融研报中的应用

    2.2 创新2:RAG 在零售中的创新

    2.3 创新3:RAG 在审批类业务中的应用

  3. 总结和思考

演讲嘉宾:王琦智 PingCAP TiDB 生态系统架构师

7 年编程与架构经验。曾在腾讯音乐、锦江等公司担任重要职务,始终致力于代码的开发与精进,并专注于开发者生态建设,研发效率及体验提升,开发者赋能。 目前,在 PingCAP 负责 TiDB 生态系统架构及开发者 Advocate。

演讲主题:下一代 RAG:tidb.ai 使用知识图谱增强 RAG 能力

TiDB Serverless 最近引入了 Vector 类型,使 MySQL 系数据库内进行向量搜索成为可能。为了增强社区问答的效率并节省人力,我们推出了 tidb.aitidb.ai 是 TiDB 为提高社区活性和转化率而构建的人工智能问答机器人,基于 TiDB 文档生成答案。

演讲大纲

  1. tidb.ai 是什么

  2. 简单 RAG 的实现方案

  3. 为什么需要 Rerank?

  4. 知识图谱助力 RAG

  5. Vector type within TiDB > TiDB + Vector Database

  6. All in one 数据库帮助开发者减负

  7. Ending

演讲嘉宾:陈茏久 阿里云高级产品专家

曾任职于多家世界 500 强企业,具有丰富的数据产品经验, 专注于数据库、数据智能、AI 等相关领域。 当前负责阿里云 OLAP 和工具产品, 助力企业放大数据价值,实现数据驱动业务高速增长。

演讲主题:AnalyticDB 向量检索引擎:搭积木式轻松开发专属大模型应用

本次分享将介绍在 LLM 驱动的行业变革下, 企业如何快速结合自身知识,实现于大语言模型的融合,对当先的业态进行智能化升级,实现多场景的能力升级; 在数百客户的服务过程中,探索如何在向量之上构建全链路 RAG 服务,并与阿里云百炼一起帮助企业 + 个人开发者灵活落地应用。

演讲大纲

  1. 大模型带来的行业变革
  2. 向量数据库驱动的RAG服务化探索
  3. 百炼 + AnalyticDB,构建安全可靠的企业级 RAG 服务

分享本推文或论坛海报朋友圈/ 微信群/ 微博/ 抖音/ B站/ 小红书 等任一社交平台,将你的分享截图上传到活动问卷,我们会抽出「30位幸运儿」送出虎虎生金工卡套或解码系列皮革鼠标垫,抽出「30位幸运儿」送出稀土开发者大会线下门票~

💬 更多精彩内容,欢迎加入稀土开发者大会交流群

相关推荐
FL162386312925 分钟前
AI健身体能测试之基于paddlehub实现引体向上计数个数统计
人工智能
黑客-雨28 分钟前
构建你的AI职业生涯:从基础知识到专业实践的路线图
人工智能·产品经理·ai大模型·ai产品经理·大模型学习·大模型入门·大模型教程
子午30 分钟前
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
人工智能·python·cnn
大耳朵爱学习1 小时前
掌握Transformer之注意力为什么有效
人工智能·深度学习·自然语言处理·大模型·llm·transformer·大语言模型
TAICHIFEI1 小时前
目标检测-数据集
人工智能·目标检测·目标跟踪
qq_15321452641 小时前
【2023工业异常检测文献】SimpleNet
图像处理·人工智能·深度学习·神经网络·机器学习·计算机视觉·视觉检测
洛阳泰山1 小时前
如何使用Chainlit让所有网站快速嵌入一个AI聊天助手Copilot
人工智能·ai·llm·copilot·网站·chainlit·copliot
儿创社ErChaungClub1 小时前
解锁编程新境界:GitHub Copilot 让效率翻倍
人工智能·算法
乙真仙人1 小时前
AIGC时代!AI的“iPhone时刻”与投资机遇
人工智能·aigc·iphone
十启树1 小时前
用Qt 对接‌百度AI平台
人工智能·qt·百度