作为后端开发你不得不知的 AI 知识——RAG

作为后端开发你不得不知的 AI 知识------RAG

前言

我们知道,大模型的知识都是固化的,它不认识你公司的最新产品,而 RAG 就是为模型提供知识库的一种有效方法。

基于 RAG(Retrieval Augmented Generation,检索增强生成) 构建知识库,是大模型兴起之后最快被采纳接收的架构范式之一。当前,RAG 系统已经被广泛地应用在客服问答、个性化推荐、智能对话助手等场景中。RAG 技术能够弥补大模型因知识截止而无法获取最新信息的问题,并有效降低其产生幻觉的风险,而且 RAG 技术相比于大模型后训练或微调方式,以更加成本低的方式与企业的专有数据对接,以实现大模型快速技术验证和商业化尝试。

RAG 知识库的应用架构

基于 RAG 构建知识库的应用架构如下。可以简单划分为离线索引建构在线检索和生成过程

  • 离线向量过程通过把用户上传的文档进行文档智能解析、切片,再进行向量化存储到向量数据库。
  • 在线过程则把用户的请求问题向量化之后与向量库中的切片向量进行相似度比对,慈悲个人召回最接近用户问题的相关切片。

如今构建上图这样的 RAG 系统已经变得非常简单,开源社区和商业产品都提供了非常简便的构建方式。在满足复杂的业务需求的过程中,通常一个简单的 RAG 系统无法满足业务需求,会遭遇准确率和召回率的挑战、信息冗余噪声导致的模型幻觉、知识库庞杂难以管理等问题。当前 RAG 系统的构建也逐步向模块化、Agentic RAG 的高级架构演进。

从离线过程来看,文档解析技术除了经典的 OCR 和电子解析技术,也在利用大模型进行更准确的文档解析,比如对于图片类的文档,通过 VLM 视觉 理解大模型,能够对这类文档进行更全面的文档理解。

从在线检索过程来看,检索前、检索中、检索后过程里,都发展出很多的技术手段来加强和管理整体 RAG 的效果。

如:

  • 检索前可以增加 Query 改写、知识库路由等模块
  • 检索过程可以采用混合检索策略
  • 检索后可以增加充排序、拒识模块等。

从构建包含 RAG 的 AI 应用来看,Agentic RAG 成为新的趋势之一,用户将知识库检索作为大模型的工具之一,由大模型来决定是否以及何时进行检索以获取必要的知识库信息。另外,多模态 RAG 技术也是当前蓬勃发展的领域,随着多模态理解大模型能力的增强,多模态 Embedding 向量模型也取得了重大的发展。基于多模态向量模型的 RAG 系统在商品搜推、视频创作等各类场景已经获得了规模化的落地。

RAG 知识库的应用场景

知识库落地有广泛的应用场景,包括客服服务、个性化推荐、AI 陪伴、内容创作等。其中客服服务 RAG 是最广泛落地的应用之一,从业务特征来看,通常需要大量的业务背景知识,并且这些知识是不断更新的,例如常见问题解答(FAQ)、产品规格、故障排除指南以及公司政策等。

在这些场景里,知识库是严格知识的来源、可信任,作为降低大模型幻觉的重要手段。甚至在更加严肃的场景里,许多用户将大模型只作为知识库的整理工具,要求大模型回答需要严格遵循知识库里的知识,不能随意发挥,以避免严重的客诉问题。

不过当前 RAG 的应用也已经超越简单的回答。基于 RAG 的系统,叠加大模型分析客户对话数据等能力,能够帮助企业优化服务策略和挖掘销售线索等。RAG 的价值正在从解决幻觉这一技术问题,向赋能业务的更高层面演进。多模态 RAG 的兴起,将 RAG 的应用边界从纯粹的知识问答推向了更广阔的领域:

  1. 零售电商场景:用户 可以通过上传图片来检索商品,从而实现商品图搜和个性化推荐。
  2. 媒体娱乐领域:多模态 RAG 也帮助从海量音频视频内容中检索出特定的片段,从而服务于音视频内容分发以及新型的 AI 视频创作场景。

RAG 知识库的未来发展

大模型发展至今,RAG 作为最成熟的 AI 应用架构之一,尽管基础 RAG 的实现已趋于成熟,但仍有人认为其技术含量不高。然而,我们观察到,构建一个真正满足复杂业务需求的高级 RAG 系统仍然充满挑战,并且该领域正在不断演进。比如在当前 Advanced RAG 架构里,仍然有许多技术问题待解决。多模态 RAG 相关的技术,也在快速地发展当中,其应用场景和想象力空间更大。

无论未来 LLM 架构如何演变,只要它们仍然依赖外部知识来增强其能力,向量检索作为一种高效、语义化的上下文获取机制,仍然将发挥重要的价值。

相关推荐
NAGNIP20 小时前
轻松搞懂全连接神经网络结构!
人工智能·算法·面试
moshuying1 天前
别让AI焦虑,偷走你本该有的底气
前端·人工智能
董董灿是个攻城狮1 天前
零基础带你用 AI 搞定命令行
人工智能
喝拿铁写前端1 天前
Dify 构建 FE 工作流:前端团队可复用 AI 工作流实战
前端·人工智能
阿里云大数据AI技术1 天前
阿里云 EMR Serverless Spark + DataWorks 技术实践:引领企业 Data+AI 一体化转型
人工智能
billhan20161 天前
MCP 深入理解:协议原理与自定义开发
人工智能
Jahzo1 天前
openclaw桌面端体验--ClawX
人工智能·github
billhan20161 天前
Agent 开发全流程:从概念到生产
人工智能
threerocks1 天前
过了个年,AI 圈变天了?但没人告诉你为什么
人工智能