SGPT: GPT Sentence Embeddings for Semantic Search

简介

语义搜索分为两个部分:

1.搜索和query 相关的topk文档。

2.理解文档和query后面隐藏的语义信息,而不是字面含义。

这篇论文提出了SGPT模型,只用decoder-only的transformer来进行语义搜索和sentence向量的提取。

1.SGPT-BE:来对文档和query进行粗略的相关度计算,由于可以对文档的向量进行缓存,所以计算量和文档的数量线性相关,SGPT使用了BitFit的方式只对模型bias等少部分参数进行微调,大部分模型参数在微调的过程中是被冻结的,所以能够大大提升模型的训练效率。

2.SGPT-CE:对文档和query进行concat拼接,拼接后输入到gpt模型中去,对模型输出的query token的概率进行sum pooling的方式,作为文档的得分。由于CE的方式每一个query都需要重复计算很多次,所以计算量比较大,所以一般是在BE之后,对top的文档进行encoder概率计算。

SGPT Cross-Encoder


SGPT Bi-Encoder

相关推荐
Cosolar1 小时前
Agent Skills 深度解析:AI 编码代理的工程化生产级工作流引擎
人工智能·面试·开源
大模型真好玩2 小时前
LangChain DeepAgents 速通指南(七)—— DeepAgents使用Agent Skill
人工智能·langchain·deepseek
uzong2 小时前
最新:阿里正式发布首款AI开发工具Meoo(秒悟),0门槛、一键部署上线
人工智能·后端
MediaTea2 小时前
ML:数据集、训练集与测试集
人工智能
hughnz2 小时前
钻井RTOC的能力以及趋势
大数据·人工智能
三秋树2 小时前
豆包 Agent Harness 工程师入门 | 第 4 章 子 Agent
人工智能·agent·ai编程
xiaotao1312 小时前
03-深度学习基础:循环神经网络(RNN)
人工智能·深度学习·机器学习
渣渣xiong2 小时前
从零开始:前端转型AI agent直到就业第十四天-第十七天
前端·人工智能
逍遥归来2 小时前
窥探Claude Code源码:Context上下文管理机制
人工智能