LangChain应用开发指南-大模型的知识外挂RAG

AI大模型能够处理广泛主题的文本生成,但模型知识只能基于它们训练时使用的公开数据。如果你想构建能够利用私有数据或实时数据进行推理的AI应用,你需要用特定的信息来增强模型的知识。将相关信息检索并插入到模型的输入中,即检索增强生成(Retrieval Augmented Generation,RAG)。

LangChain应用开发指南系列课程,没有看过的小伙伴可以点击链接查看: AI课程合集

在本文中,我们将介绍如何使用LangChain开发一个简单的RAG问答应用。我们将依次介绍典型的问答架构,讨论相关的LangChain组件,并展示如何跟踪和理解我们的应用。

RAG的基本概念

RAG是一种结合了检索和生成的技术,它可以让大模型在生成文本时利用额外的数据源,从而提高生成的质量和准确性。RAG的基本流程如下:

  • 首先,给定一个用户的输入,例如一个问题或一个话题,RAG会从一个数据源中检索出与之相关的文本片段,例如网页、文档或数据库记录。这些文本片段称为上下文(context)。
  • 然后,RAG会将用户的输入和检索到的上下文拼接成一个完整的输入,传递给一个大模型,例如GPT。这个输入通常会包含一些提示(prompt),指导模型如何生成期望的输出,例如一个答案或一个摘要。
  • 最后,RAG会从大模型的输出中提取或格式化所需的信息,返回给用户。

LangChain和RAG的结合

LangChain是一个专注于大模型应用开发的平台,它提供了一系列的组件和工具,帮助你轻松地构建RAG应用。LangChain提供了以下的组件来帮助你构建RAG应用:

  • 数据加载器(DocumentLoader):数据加载器是一个对象,可以从一个数据源加载数据,并将其转换为文档(Document)对象。一个文档对象包含两个属性:page_content(str)和metadata(dict)。page_content是文档的文本内容,metadata是文档的元数据,例如标题、作者、日期等。
  • 文本分割器(DocumentSplitter):文本分割器是一个对象,可以将一个文档对象分割成多个较小的文档对象。这样做的目的是为了方便后续的检索和生成,因为大模型的输入窗口是有限的,而且在较短的文本中更容易找到相关的信息。
  • 文本嵌入器(Embeddings):文本嵌入器是一个对象,可以将文本转换为嵌入(Embedding),即一个高维的向量。文本嵌入可以用来衡量文本之间的相似度,从而实现检索的功能。
  • 向量存储器(VectorStore):向量存储器是一个对象,可以存储和查询嵌入。向量存储器通常使用一些索引技术,例如Faiss或Annoy,来加速嵌入的检索。
  • 检索器(Retriever):检索器是一个对象,可以根据一个文本查询返回相关的文档对象。检索器的一种常见实现是向量存储器检索器(VectorStoreRetriever),它使用向量存储器的相似度搜索功能来实现检索。
  • 聊天模型(ChatModel):聊天模型是一个对象,可以根据一个输入序列生成一个输出消息。聊天模型通常基于大模型,例如GPT-3,来实现文本生成的功能。

使用LangChain构建RAG应用的一般流程如下:

  • 首先,我们需要加载我们的数据。我们可以使用数据加载器来实现这一步,根据数据源的类型选择合适的数据加载器。例如,如果我们的数据源是一个网页,我们可以使用WebBaseLoader,它可以使用urllib和BeautifulSoup来加载和解析网页,返回一个文档对象。
  • 然后,我们需要将我们的文档对象分割成较小的文档对象。我们可以使用文本分割器来实现这一步,根据文本的特点选择合适的文本分割器。例如,如果我们的文本是一个博客文章,我们可以使用RecursiveCharacterTextSplitter,它可以递归地使用常见的分隔符(如换行符)来分割文本,直到每个文档对象的大小符合要求。
  • 接下来,我们需要将我们的文档对象转换为嵌入,并存储到向量存储器中。我们可以使用文本嵌入器和向量存储器来实现这一步,根据嵌入的质量和速度选择合适的文本嵌入器和向量存储器。例如,如果我们想要使用OpenAI的嵌入模型和Chroma的向量存储器,我们可以使用OpenAIEmbeddings和ChromaVectorStore。
  • 然后,我们需要创建一个检索器,用于根据用户的输入检索相关的文档对象。我们可以使用向量存储器检索器来实现这一步,- 传递一个向量存储器对象和一个文本嵌入器对象作为参数,创建一个向量存储器检索器对象。
  • 最后,我们需要创建一个聊天模型,用于根据用户的输入和检索到的文档对象生成一个输出消息。我们可以使用LangChain提供的聊天模型来实现这一步,根据模型的性能和成本选择合适的聊天模型。例如,如果我们想要使用OpenAI的GPT-3模型,我们可以使用OpenAIChatModel。

下面是一个使用LangChain构建RAG应用的示例代码:

python 复制代码
# 导入LangChain的库
from langchain import *

# 加载数据源
loader = WebBaseLoader()
doc = loader.load("https://xxx.html")

# 分割文档对象
splitter = RecursiveCharacterTextSplitter(max_length=512)
docs = splitter.split(doc)

# 转换文档对象为嵌入,并存储到向量存储器中
embedder = OpenAIEmbeddings()
vector_store = ChromaVectorStore()
for doc in docs:
    embedding = embedder.embed(doc.page_content)
    vector_store.add(embedding, doc)

# 创建检索器
retriever = VectorStoreRetriever(vector_store, embedder)

# 创建聊天模型
prompt = hub.pull("rlm/rag-prompt")
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# 创建一个问答应用
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)


rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

# 启动应用
rag_chain.invoke("What is main purpose of xxx.html?")

LangChain和RAG的优势和应用场景

LangChain和RAG的结合可以带来以下的优势:

  • 灵活性:你可以根据你的需求和数据源选择不同的组件和参数,定制你的RAG应用。你也可以使用自定义的组件,只要它们遵循LangChain的接口规范。
  • 可扩展性:你可以使用LangChain的云服务来部署和运行你的RAG应用,无需担心资源和性能的限制。你也可以使用LangChain的分布式计算功能来加速你的RAG应用,利用多个节点的并行处理能力。
  • 可视化:你可以使用LangSmith来可视化你的RAG应用的工作流程,查看每个步骤的输入和输出,以及每个组件的性能和状态。你也可以使用LangSmith来调试和优化你的RAG应用,发现和解决潜在的问题和瓶颈。

LangChain和RAG的结合可以应用于多种场景,例如:

  • 专业问答(Professional Question Answering):你可以使用LangChain和RAG来构建一个专业领域的问答应用,例如医疗、法律或金融。你可以从专业领域的数据源中检索相关的信息,帮助大模型回答用户的问题。例如,你可以从医学文献中检索疾病的诊断和治疗方案,帮助大模型回答医疗相关的问题。
  • 文本摘要(Text Summarization):你可以使用LangChain和RAG来构建一个文本摘要应用,例如新闻摘要或论文摘要。你可以从多个数据源中检索相关的文本,帮助大模型生成一个综合的摘要。例如,你可以从多个新闻网站中检索关于同一事件的报道,帮助大模型生成一个全面的摘要。
  • 文本生成(Text Generation):你可以使用LangChain和RAG来构建一个文本生成应用,例如诗歌生成或故事生成。你可以从不同的数据源中检索灵感,帮助大模型生成更有趣和更有创意的文本。例如,你可以从诗歌、歌词或小说中检索相关的文本,帮助大模型生成一首诗、一首歌或一个故事。

结论

在本文中,我们介绍了如何使用LangChain开发一个简单的问答应用。我们介绍了RAG的基本概念和优势,讨论了相关的LangChain组件。我们还介绍了LangChain和RAG的结合的优势和应用场景。

我们希望本文能够帮助你了解LangChain和RAG的结合的潜力和价值,鼓励你尝试使用LangChain和RAG开发自己的应用。如果你有任何问题或建议,欢迎联系我们,我们期待与你的交流和合作。

参考资料:

相关推荐
Estar.Lee42 分钟前
查手机号归属地免费API接口教程
android·网络·后端·网络协议·tcp/ip·oneapi
2401_857610032 小时前
SpringBoot社团管理:安全与维护
spring boot·后端·安全
凌冰_3 小时前
IDEA2023 SpringBoot整合MyBatis(三)
spring boot·后端·mybatis
码农飞飞3 小时前
深入理解Rust的模式匹配
开发语言·后端·rust·模式匹配·解构·结构体和枚举
一个小坑货3 小时前
Rust 的简介
开发语言·后端·rust
monkey_meng4 小时前
【遵守孤儿规则的External trait pattern】
开发语言·后端·rust
Estar.Lee4 小时前
时间操作[计算时间差]免费API接口教程
android·网络·后端·网络协议·tcp/ip
新知图书5 小时前
Rust编程与项目实战-模块std::thread(之一)
开发语言·后端·rust
盛夏绽放5 小时前
Node.js 和 Socket.IO 实现实时通信
前端·后端·websocket·node.js
Ares-Wang5 小时前
Asp.net Core Hosted Service(托管服务) Timer (定时任务)
后端·asp.net