12.RAG知识库—快速入门

目录

一.前景回顾

二.存储(构建向量数据库操作对象)

1.引入依赖

2.加载知识数据文档

3.构建向量数据库操作对象,把文档切割、向量化并存储到向量数据库中

三.检索(构建向量数据库检索对象)

1.构建向量数据库检索对象

2.配置向量数据库检索对象

四.重启项目,查看效果

1.测试效果

2.原理

五.缺点与解决方案

1.缺点

2.原因

3.解决方案

4.解决效果


一.前景回顾

我们通过之前的文章:

11.RAG知识库的原理-CSDN博客

讲了RAG知识库的原理,并且可以将一些未公开的文档,分割、向量化后,存入RAG知识库,从而让大模型有回答未公开的内部知识问题的能力。(比如回答公司内部系统的使用方法等问题)。
本篇文章的目的是,如何具体实现这个操作?

见下文的【二】、【三】

二.存储(构建向量数据库操作对象)

1.引入依赖

XML 复制代码
<!--rag-easy依赖-->
<dependency>
    <groupId>dev.langchain4j</groupId>
    <artifactId>langchain4j-easy-rag</artifactId>
    <version>1.0.1-beta6</version>
</dependency>

2.加载知识数据文档

先准备一个文档(我们让AI生成了一个"鸿剑有限公司内部文档.md",是一个markdown类型的文件),如下图:

将该文档,上传到java项目中:

3.构建向量数据库操作对象,把文档切割、向量化并存储到向量数据库中

在下面的配置类中,添加如下代码:

java 复制代码
//构建向量数据库操作对象(存储)
@Bean//将返回值放入IOC容器,供后续使用
public EmbeddingStore myEmbeddingStore(){//这个方法名不能叫embeddingStore,因为会和默认的重复,所以我们叫myEmbeddingStore
    //1.加载resources/content/目录下的所有文档到内存中
    List<Document> documents = ClassPathDocumentLoader.loadDocuments("content");
    //2.构建向量数据库操作对象
    InMemoryEmbeddingStore store = new InMemoryEmbeddingStore();
    //3.构建一个EmbeddingStoreIngestor对象,完成文本数据切割、向量化、存储
    EmbeddingStoreIngestor ingestor = EmbeddingStoreIngestor.builder()
            .embeddingStore(store)//向量化后的数据,指定存储到store中
            .build();
    ingestor.ingest(documents);//指定要存的内容,就是resources/content/目录下的所有文档
    //4.返回store
    return store;
}

三.检索(构建向量数据库检索对象)

1.构建向量数据库检索对象

在下面的配置类中,添加如下代码:

java 复制代码
//构建向量数据库检索对象(检索)
@Bean
public ContentRetriever contentRetriever(EmbeddingStore store){
    return EmbeddingStoreContentRetriever.builder()
            .embeddingStore(store) //要从store中,检索知识片段
            .minScore(0.5)//只要余弦相似度大于0.5,我们就要
            .maxResults(3)//最多检索出三个知识片段
            .build();
}

2.配置向量数据库检索对象

四.重启项目,查看效果

问几个问题,看看是否和我们提供的内部文档一致?


1.测试效果

此时大模型,可以完美地根据我们提供的手册,进行回答问题。

此时我们只在resources/content/目录下,传了一个文档,那么只要我们传入足够多的文档,那么RAG知识库就会有更多的知识,从而让大模型借鉴,来回答我们的各种问题。

2.原理

查看后端控制台,可见,java后端会将用户的问题,和从RAG数据库检索出的相关知识片段,一起发送给大模型,从而让大模型有专业知识的回答能力。

五.缺点与解决方案

1.缺点

目前我们引入了RAG知识库以后,无论用户问什么问题,后端都会去RAG知识库搜索相关的知识片段,搜不到就无法回答。

2.原因

理想状态下,如果从RAG知识库中,搜不到与用户问题相关的知识片段,那就应该直接调用大模型了,不应该被知识有限的RAG知识库拖累。

说白了,就是没有意图识别的功能。

我猜测,应该是langchain4j实现这一块的功能时,如果从RAG知识库找不到用户问题相关的知识片段,调用大模型时就会给提示词"只根据知识库的结果回答"。所以我们应该去掉这个

3.解决方案

添加系统提示词"如果你无法通过RAG知识库检索出用户问题相关的知识片段,那么请直接调用大模型,就不要提文档了"

4.解决效果

可见此时,RAG知识库就完全是锦上添花了,而不会影响大模型本身的通用问题回答能力。

到此,目的达到了!

以上就是本篇文章的全部内容,喜欢的话可以留个免费的关注呦~~~

相关推荐
java1234_小锋3 天前
嵌入模型与Chroma向量数据库 - Chroma安装与简单应用实例 - AI大模型应用开发必备知识
人工智能·向量数据库·chroma
java1234_小锋6 天前
嵌入模型与Chroma向量数据库 - Qwen3嵌入模型使用 - AI大模型应用开发必备知识
人工智能·向量数据库·chroma
长路 ㅤ   7 天前
Milvus系列之02、Spring+Milvus实现RAG检索增强
向量数据库·apache tika·langchain4j·知识库构建·hanlp分词
长路 ㅤ   7 天前
dify系列之01、快速本地一键搭建dify
向量数据库·llmops·知识库管理·docker容器化·dify部署
java1234_小锋7 天前
嵌入模型与Chroma向量数据库 - 嵌入模型与向量数据库简介 - AI大模型应用开发必备知识
人工智能·向量数据库·chroma
马克Markorg8 天前
SpringBoot + LangChain4j 打造企业级 RAG 智能知识库,多工具集成方案
spring boot·向量数据库·rag·qdrant·langchain4j·增强知识检索库
长路 ㅤ   10 天前
长路的AI领域技术博客汇总文档
向量数据库·大模型部署·langchain4j·智能体agent·ai后端技术
Hoking15 天前
milvus向量数据库介绍与部署(docker-compose)
人工智能·milvus·向量数据库
uncle_ll21 天前
Milvus介绍及多模态检索实践:从部署到实战全解析
milvus·多模态·向量数据库·ann·rag·搜索·检索
ASS-ASH23 天前
AI时代之向量数据库概览
数据库·人工智能·python·llm·embedding·向量数据库·vlm