RAG-day2

Komorebi_99992026-05-08 11:36

一、文本分块

作用：长文档不能直接喂给大模型，必须切成小块，避免超出上下文限制、检索更精准。
常见分块方式：固定大小分块、按段落分块、按语义分块。
分块原则：块不能太大（冗余多）、不能太小（语义不完整）。

二、向量化与嵌入模型

嵌入模型（Embedding 模型）：专门负责把文本转成向量的模型。
特点：语义越相似的文本，转化后的向量数值越接近。
作用：是语义检索的基础，没有向量化就做不了语义匹配。

三、向量数据库

定义：专门用来存储向量、快速做相似度检索的数据库。
和普通数据库区别：普通库适合精确匹配；向量库适合语义相似度匹配。
常见用途：存放文档块向量、用户问题向量，供 RAG 快速检索。

四、RAG 细化完整链路（含隐藏子步骤）

文档接入→ 文本分块→ 嵌入模型向量化→ 向量入库（存向量数据库）→ 用户提问向量化→ 向量库语义检索→ 拼接检索片段 + 用户提示词→ 大模型增强生成答案

五、语义检索核心逻辑

用户问题 → 转向量
和向量库里所有文档块向量算相似度
取出相似度最高的 Top-N 片段
作为参考资料给大模型

上一篇：彻底搞懂 Linux 基础 IO：文件描述符、重定向、dup2、缓冲区一次讲透！

下一篇：【技术干货】用 AI + Expo 打通 iOS / Android / Web 跨端应用开发：从架构到代码生成实战

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 06AI科技热点日报 | 2026年07月01日 07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 10几个好用的ip纯净度检测网站