机器学习排序方法

一、单文档方法(Pointwise)

处理对象是单一文档,将文档转换为特征向量后,将排序问题转化为机器学习中常规的分类或回归问题。CTR方法是单文档方法的典型应用,相对比较成熟,广泛应用于广告、搜索、推荐中。y=f(x),其中y属于[0,1],y的值越大表示用户点击率越高。

样本之间互不影响

二、文档对方法(Pairwise)

相比于单文档方法,文档对方法将重点转向文档顺序关系,是目前相对比较流行的方法。其输入是文档对,输出是局部的优先顺序,主要是将排序问题转化为二分类问题。对于同一query的相关文档集中,任何两个不同标记的文档都可以组成一个训练实例(di,dj),如果di>dj,则赋值为1,视为正例;反之赋值为-1(或者0),视为负例,这样就得到二分类模型所需的训练样本。预测时可以得到所有文档的偏序关系,从而实现排序。

文档之间先后循序相互影响。

三、文档列表方法(Listwise)

把每个查询对应的所有搜索结果列表作为一个训练样例。根据训练样例训练得到的最优评分函数F,评分函数F对每个文档打分,然后根据得分由高到低排序,得到最终的排序结果。

相关推荐
悦数图数据库2 分钟前
“复旦大学—杭州悦数先进金融图技术校企联合研究中心年度总结会”圆满举行
大数据·数据库·人工智能
星浩AI5 分钟前
LCEL:打造可观测、可扩展、可部署的 LangChain 应用
人工智能·后端·python
agicall.com5 分钟前
信创电话助手自动录音功能说明
人工智能·语音识别·自动录音·座机录音·固话录音
初次攀爬者7 分钟前
RAG核心升级|多LLM模型动态切换方案
人工智能·后端·ai编程
yunni810 分钟前
知识库 × AI写作:打通公文写作的“最后一公里”
大数据·人工智能
Baihai_IDP13 分钟前
Andrej Karpathy:2025 年 LLM 领域的六项范式转变
人工智能·面试·llm
踩着两条虫13 分钟前
VTJ.PRO「AI + 低代码」应用开发平台的后端模块系统
前端·人工智能·低代码
人工智能AI技术14 分钟前
开源模型落地指南:DeepSeek微调实战,在垂直场景打造差异化竞争力
人工智能
一个会的不多的人14 分钟前
人工智能基础篇:概念性名词浅谈(第二十二讲)
人工智能·制造·数字化转型
极新15 分钟前
新看点/818AI创始人冷煜:AI落地,决胜“最后100米” | 2025极新AIGC峰会演讲实录
大数据·人工智能