作为后端开发你不得不知的 AI 知识——RAG

作为后端开发你不得不知的 AI 知识------RAG

前言

我们知道,大模型的知识都是固化的,它不认识你公司的最新产品,而 RAG 就是为模型提供知识库的一种有效方法。

基于 RAG(Retrieval Augmented Generation,检索增强生成) 构建知识库,是大模型兴起之后最快被采纳接收的架构范式之一。当前,RAG 系统已经被广泛地应用在客服问答、个性化推荐、智能对话助手等场景中。RAG 技术能够弥补大模型因知识截止而无法获取最新信息的问题,并有效降低其产生幻觉的风险,而且 RAG 技术相比于大模型后训练或微调方式,以更加成本低的方式与企业的专有数据对接,以实现大模型快速技术验证和商业化尝试。

RAG 知识库的应用架构

基于 RAG 构建知识库的应用架构如下。可以简单划分为离线索引建构在线检索和生成过程

  • 离线向量过程通过把用户上传的文档进行文档智能解析、切片,再进行向量化存储到向量数据库。
  • 在线过程则把用户的请求问题向量化之后与向量库中的切片向量进行相似度比对,慈悲个人召回最接近用户问题的相关切片。

如今构建上图这样的 RAG 系统已经变得非常简单,开源社区和商业产品都提供了非常简便的构建方式。在满足复杂的业务需求的过程中,通常一个简单的 RAG 系统无法满足业务需求,会遭遇准确率和召回率的挑战、信息冗余噪声导致的模型幻觉、知识库庞杂难以管理等问题。当前 RAG 系统的构建也逐步向模块化、Agentic RAG 的高级架构演进。

从离线过程来看,文档解析技术除了经典的 OCR 和电子解析技术,也在利用大模型进行更准确的文档解析,比如对于图片类的文档,通过 VLM 视觉 理解大模型,能够对这类文档进行更全面的文档理解。

从在线检索过程来看,检索前、检索中、检索后过程里,都发展出很多的技术手段来加强和管理整体 RAG 的效果。

如:

  • 检索前可以增加 Query 改写、知识库路由等模块
  • 检索过程可以采用混合检索策略
  • 检索后可以增加充排序、拒识模块等。

从构建包含 RAG 的 AI 应用来看,Agentic RAG 成为新的趋势之一,用户将知识库检索作为大模型的工具之一,由大模型来决定是否以及何时进行检索以获取必要的知识库信息。另外,多模态 RAG 技术也是当前蓬勃发展的领域,随着多模态理解大模型能力的增强,多模态 Embedding 向量模型也取得了重大的发展。基于多模态向量模型的 RAG 系统在商品搜推、视频创作等各类场景已经获得了规模化的落地。

RAG 知识库的应用场景

知识库落地有广泛的应用场景,包括客服服务、个性化推荐、AI 陪伴、内容创作等。其中客服服务 RAG 是最广泛落地的应用之一,从业务特征来看,通常需要大量的业务背景知识,并且这些知识是不断更新的,例如常见问题解答(FAQ)、产品规格、故障排除指南以及公司政策等。

在这些场景里,知识库是严格知识的来源、可信任,作为降低大模型幻觉的重要手段。甚至在更加严肃的场景里,许多用户将大模型只作为知识库的整理工具,要求大模型回答需要严格遵循知识库里的知识,不能随意发挥,以避免严重的客诉问题。

不过当前 RAG 的应用也已经超越简单的回答。基于 RAG 的系统,叠加大模型分析客户对话数据等能力,能够帮助企业优化服务策略和挖掘销售线索等。RAG 的价值正在从解决幻觉这一技术问题,向赋能业务的更高层面演进。多模态 RAG 的兴起,将 RAG 的应用边界从纯粹的知识问答推向了更广阔的领域:

  1. 零售电商场景:用户 可以通过上传图片来检索商品,从而实现商品图搜和个性化推荐。
  2. 媒体娱乐领域:多模态 RAG 也帮助从海量音频视频内容中检索出特定的片段,从而服务于音视频内容分发以及新型的 AI 视频创作场景。

RAG 知识库的未来发展

大模型发展至今,RAG 作为最成熟的 AI 应用架构之一,尽管基础 RAG 的实现已趋于成熟,但仍有人认为其技术含量不高。然而,我们观察到,构建一个真正满足复杂业务需求的高级 RAG 系统仍然充满挑战,并且该领域正在不断演进。比如在当前 Advanced RAG 架构里,仍然有许多技术问题待解决。多模态 RAG 相关的技术,也在快速地发展当中,其应用场景和想象力空间更大。

无论未来 LLM 架构如何演变,只要它们仍然依赖外部知识来增强其能力,向量检索作为一种高效、语义化的上下文获取机制,仍然将发挥重要的价值。

相关推荐
共享家95278 小时前
Vibe Coding 与 LangChain、LangGraph 的协同进化
人工智能
dvlinker8 小时前
2026远程桌面安全白皮书:ToDesk/TeamViewer/向日葵核心安全性与合规性横向测评
人工智能
2的n次方_8 小时前
CANN ascend-transformer-boost 深度解析:针对大模型的高性能融合算子库与算力优化机制
人工智能·深度学习·transformer
熊猫_豆豆8 小时前
YOLOP车道检测
人工智能·python·算法
nimadan128 小时前
**热门短剧小说扫榜工具2025推荐,精准捕捉爆款趋势与流量
人工智能·python
qq_12498707538 小时前
基于JavaWeb的大学生房屋租赁系统(源码+论文+部署+安装)
java·数据库·人工智能·spring boot·计算机视觉·毕业设计·计算机毕业设计
杜子不疼.8 小时前
CANN算子基础框架库opbase的算子开发与扩展机制深度解析
人工智能
程序猿追8 小时前
CANN ops-math仓库解读 数学算子的底层支撑与高性能实现
人工智能·架构
结局无敌8 小时前
统一算子语言:cann/ops-nn 如何为异构AI世界建立通用“方言”
人工智能·cann