使用LangChain的生成式AI——构建像ChatGPT这样的聊天机器人由LLM(大型语言模型)驱动的聊天机器人在客户服务等对话任务中表现出色。然而,它们在世界知识方面的缺乏限制了它们在特定领域问答中的效用。在本章中,我们将探讨如何通过检索增强生成(Retrieval-Augmented Generation,RAG)来克服这些限制。RAG通过将聊天机器人的回复基于外部证据来源,实现了更准确和信息丰富的答案。这是通过从语料库中检索相关段落来调整语言模型的生成过程来实现的。关键步骤包括将语料库编码为向量嵌入,以实现快速语义搜索,并将检索结果集成到聊天机器人的提示中。