SGPT: GPT Sentence Embeddings for Semantic Search

简介

语义搜索分为两个部分:

1.搜索和query 相关的topk文档。

2.理解文档和query后面隐藏的语义信息,而不是字面含义。

这篇论文提出了SGPT模型,只用decoder-only的transformer来进行语义搜索和sentence向量的提取。

1.SGPT-BE:来对文档和query进行粗略的相关度计算,由于可以对文档的向量进行缓存,所以计算量和文档的数量线性相关,SGPT使用了BitFit的方式只对模型bias等少部分参数进行微调,大部分模型参数在微调的过程中是被冻结的,所以能够大大提升模型的训练效率。

2.SGPT-CE:对文档和query进行concat拼接,拼接后输入到gpt模型中去,对模型输出的query token的概率进行sum pooling的方式,作为文档的得分。由于CE的方式每一个query都需要重复计算很多次,所以计算量比较大,所以一般是在BE之后,对top的文档进行encoder概率计算。

SGPT Cross-Encoder


SGPT Bi-Encoder

相关推荐
中冕—霍格沃兹软件开发测试6 分钟前
探索性测试:思维驱动下的高效缺陷狩猎
人工智能·科技·开源·appium·bug
cnfalcon7 分钟前
ESP-IDF AI硬件开发技术问题记录
人工智能·esp-idf
陈佬昔没带相机8 分钟前
从罗永浩 x MiniMax 闫俊杰对谈中,一窥 AI 时代软件公司岗位变化
人工智能·程序员·敏捷开发
老马啸西风9 分钟前
成熟企业级技术平台-09-加密机 / 密钥管理服务 KMSS(Key Management & Security Service)
人工智能·深度学习·算法·职场和发展
2301_8018217111 分钟前
前期工作总结
人工智能
Ulana29 分钟前
计算机基础10大高频考题解析
java·人工智能·算法
windfantasy199031 分钟前
NCT与GESP哪个更好?线上监考与线下考点的便利性对比
人工智能
执笔论英雄32 分钟前
【LORA】
人工智能
Jerryhut1 小时前
Bev感知特征空间算法
人工智能
xian_wwq1 小时前
【学习笔记】基于人工智能的火电机组全局性能一体化优化研究
人工智能·笔记·学习·火电