腾讯云向量数据库-RAG介绍

迪丽热爱2024-04-13 17:06

1.说明

RAG结合LLM(通用大预言模型)构件基于私有文档、专业领域知识、实时信息的charbot。

2.RAG的主要步骤

知识切片成chunk
向量化chunk入库
query检索知识chunk
构件prompts
调用llm生成回答

3.优势

快速构件demo
快速理解rag
社区支持

4.痛点

投入大
效果差
调优难

5.RAG应用的效果

整体效果=文档处理效果*embedding效果*retrieval效果*LLM效果

6.数据处理的难点：解析和拆分

1.PDF格式的++多样性++ （eg:标准格式、跨页表格、离散等），++会有复杂多变的文档格式++，提高效果的困难度。

解决办法：

2.++文档内容质量++将很有程度影响最终效果。

上一篇：计算机网络（王道考研）笔记个人整理——第五章：传输层

下一篇：支持0V充电700MA线性锂电池充电芯片-YB4055SL

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 09历年考研数学一、数学二、数学三真题试卷及答案PDF 102026 年 AI 大模型 & AI 编程工具实战全总结