SGPT: GPT Sentence Embeddings for Semantic Search

简介

语义搜索分为两个部分:

1.搜索和query 相关的topk文档。

2.理解文档和query后面隐藏的语义信息,而不是字面含义。

这篇论文提出了SGPT模型,只用decoder-only的transformer来进行语义搜索和sentence向量的提取。

1.SGPT-BE:来对文档和query进行粗略的相关度计算,由于可以对文档的向量进行缓存,所以计算量和文档的数量线性相关,SGPT使用了BitFit的方式只对模型bias等少部分参数进行微调,大部分模型参数在微调的过程中是被冻结的,所以能够大大提升模型的训练效率。

2.SGPT-CE:对文档和query进行concat拼接,拼接后输入到gpt模型中去,对模型输出的query token的概率进行sum pooling的方式,作为文档的得分。由于CE的方式每一个query都需要重复计算很多次,所以计算量比较大,所以一般是在BE之后,对top的文档进行encoder概率计算。

SGPT Cross-Encoder


SGPT Bi-Encoder

相关推荐
阿里云大数据AI技术5 分钟前
用 SQL 调大模型?Hologres + 百炼,让数据开发直接“对话”AI
sql·llm
量子位6 分钟前
这届MWC真成了中国AI主场,小米直接把AI从对话框里拽出来接管物理世界了
llm·aigc
没事勤琢磨12 分钟前
如何让 OpenClaw 控制使用浏览器:让 AI 像真人一样操控你的浏览器
人工智能
用户51914958484515 分钟前
CrushFTP 认证绕过漏洞利用工具 (CVE-2024-4040)
人工智能·aigc
牛马摆渡人52832 分钟前
OpenClaw实战--Day1: 本地化
人工智能
前端小豆33 分钟前
玩转 OpenClaw:打造你的私有 AI 助手网关
人工智能
AI探索者44 分钟前
LangGraph 记忆机制:基于 Checkpointer 的状态持久化
llm
BugShare1 小时前
写一个你自己的Agent Skills
人工智能·程序员
机器之心1 小时前
英伟达护城河被AI攻破,字节清华CUDA Agent,让人人能搓CUDA内核
人工智能·openai
over6971 小时前
从 LLM 到全栈 Agent:MCP 协议 × RAG 技术如何重构 AI 的“做事能力”
面试·llm·mcp