九支-听课笔记(9-12节)

搜索系统核心架构：从"海选"到"决赛"

一个实用的搜索引擎之所以分两步走，是因为性能与精度的平衡。如果直接用复杂的 Transformer 去匹配语料库里的几百万条数据，速度会慢到用户无法忍受。

1. 第一阶段：召回模块 (Recall) ------ "海选"

这是系统的第一个漏斗，目标是快。

输入： 用户输入的原始问题（Query），例如"机器学习是什么？"。
资源库： 底部有一个巨大的离线语料库（存储了成千上万条可能的答案或文档）。
动作： 从海量数据中快速"捞"出前 32 个最相关的候选。
特点：
- 粗略相关： 计算方式比较简单（比如通过关键词匹配或简单的向量检索），能保证"相关的都在这 32 个里"，但顺序不一定完全准确。
- 高效率： 必须在毫秒级完成海量数据的筛选。

2. 中间产物：32 个相关文本（候选集）

3. 第二阶段：排序模块 (Rank) ------ "精选/决赛"

这是系统的第二个漏斗，目标是准。

输入： 用户 Query + 召回出来的 32 个候选文本。
动作： 对这 32 个文本进行精细打分。
原理： 计算 Query 与每一个回答之间深度语义的相似度 。这里通常就会用到你之前学的 Transformer/BERT 结构（利用其强大的自注意力机制捕捉语义细节）。
区别于召回：
- 更准确： 它的分数反映了真实的语义匹配程度。
- 计算量大： 因为候选集已经减小到 32 个，模型可以放心地使用复杂的数学运算来保证准确性。

4. 最终输出：重排结果 (Re-ranking)

Python源代码文件主要有.py和 .ipynb两种格式,.py是标准格式,可用多种编辑器运行;.ipynb是Jupyter Notebook专用格式,支持多语言交互,可转换为.py文件。