SGPT: GPT Sentence Embeddings for Semantic Search

简介

语义搜索分为两个部分:

1.搜索和query 相关的topk文档。

2.理解文档和query后面隐藏的语义信息,而不是字面含义。

这篇论文提出了SGPT模型,只用decoder-only的transformer来进行语义搜索和sentence向量的提取。

1.SGPT-BE:来对文档和query进行粗略的相关度计算,由于可以对文档的向量进行缓存,所以计算量和文档的数量线性相关,SGPT使用了BitFit的方式只对模型bias等少部分参数进行微调,大部分模型参数在微调的过程中是被冻结的,所以能够大大提升模型的训练效率。

2.SGPT-CE:对文档和query进行concat拼接,拼接后输入到gpt模型中去,对模型输出的query token的概率进行sum pooling的方式,作为文档的得分。由于CE的方式每一个query都需要重复计算很多次,所以计算量比较大,所以一般是在BE之后,对top的文档进行encoder概率计算。

SGPT Cross-Encoder


SGPT Bi-Encoder

相关推荐
Memene摸鱼日报8 小时前
「Memene 摸鱼日报 2025.9.16」OpenAI 推出 GPT-5-Codex 编程模型,xAI 发布 Grok 4 Fast
人工智能·aigc
xiaohouzi1122338 小时前
OpenCV的cv2.VideoCapture如何加GStreamer后端
人工智能·opencv·计算机视觉
用户125205597088 小时前
解决Stable Diffusion WebUI训练嵌入式模型报错问题
人工智能
Juchecar8 小时前
一文讲清 nn.LayerNorm 层归一化
人工智能
martinzh8 小时前
RAG系统大脑调教指南:模型选择、提示设计与质量控保一本通
人工智能
小关会打代码8 小时前
计算机视觉案例分享之答题卡识别
人工智能·计算机视觉
Juchecar8 小时前
一文讲清 nn.Linear 线性变换
人工智能
Se7en2589 小时前
使用 NVIDIA Dynamo 部署 PD 分离推理服务
人工智能
海拥9 小时前
用 LazyLLM 搭建一个代码注释 / 文档 Agent 的实测体验
人工智能
天天进步20159 小时前
用Python打造专业级老照片修复工具:让时光倒流的数字魔法
人工智能·计算机视觉