
"大模型"通常指的是大语言模型(Large Language Model, LLM) ,而"大预言、嵌入模型、重排序模型"并不是大模型本身的三种类型,而是在构建智能问答或检索增强生成(RAG)系统时,常协同使用的三个关键组件。它们各自承担不同角色,共同提升系统整体性能。
三个模型的角色分工
-
**大语言模型(LLM)**
- 角色:最终的"回答者"
- 核心作用:理解用户问题,整合检索到的信息,生成自然语言答案
- 关键词:生成、对话、理解
-
**嵌入模型(Embedding Model)**
- 角色:语义"翻译官"
- 核心作用:将文本转换为高维向量,用于在向量数据库中快速检索语义相似的内容
- 关键词:向量化、检索、匹配
-
**重排序模型(Reranker)**
- 角色:检索结果"质检员"
- 核心作用:对初步检索出的候选结果进行精细化打分与排序,提升相关性
- 关键词:排序、打分、筛选
为什么需要这三个模型协同?
-
效率与精度平衡
- 嵌入模型使用双编码器(bi-encoder)快速召回 Top 20--50 个候选文档,速度快但精度有限。
- 重排序模型使用交叉编码器(cross-encoder)对这些候选进行细粒度交互建模,显著提升排序准确性(通常提升 15--25 个百分点)。
-
分工明确,各司其职
- LLM 专注于生成高质量回答,不承担检索任务;
- 嵌入模型专注语义表示;
- 重排序模型专注精排优化。
这种架构避免了"一个模型做所有事"的性能瓶颈。
-
支持 RAG(检索增强生成)系统
在 RAG 流程中:
- 用户提问 →
- 嵌入模型检索相关文档 →
- 重排序模型精排 →
- LLM 基于精选上下文生成答案
三者缺一不可,共同决定最终输出质量。
说明
- "大预言模型"应为"大语言模型"(LLM),是中文语境下的常见误译。
- 这三个模型并非大模型的"内部组成部分",而是外部协同的系统组件。大模型本身主要包含嵌入层(Embedding Layer)、权重(Weights)和偏置(Biases)等参数结构。
- 嵌入模型和重排序模型的权重通常不公开,因其高度定制化且涉及商业机密。