机器学习排序方法

一、单文档方法(Pointwise)

处理对象是单一文档,将文档转换为特征向量后,将排序问题转化为机器学习中常规的分类或回归问题。CTR方法是单文档方法的典型应用,相对比较成熟,广泛应用于广告、搜索、推荐中。y=f(x),其中y属于[0,1],y的值越大表示用户点击率越高。

样本之间互不影响

二、文档对方法(Pairwise)

相比于单文档方法,文档对方法将重点转向文档顺序关系,是目前相对比较流行的方法。其输入是文档对,输出是局部的优先顺序,主要是将排序问题转化为二分类问题。对于同一query的相关文档集中,任何两个不同标记的文档都可以组成一个训练实例(di,dj),如果di>dj,则赋值为1,视为正例;反之赋值为-1(或者0),视为负例,这样就得到二分类模型所需的训练样本。预测时可以得到所有文档的偏序关系,从而实现排序。

文档之间先后循序相互影响。

三、文档列表方法(Listwise)

把每个查询对应的所有搜索结果列表作为一个训练样例。根据训练样例训练得到的最优评分函数F,评分函数F对每个文档打分,然后根据得分由高到低排序,得到最终的排序结果。

相关推荐
未来之窗软件服务3 分钟前
幽冥大陆(九十三 ) PHP分词服务源码 —东方仙盟练气期
人工智能·nlp·仙盟创梦ide·东方仙盟·分词服务
t198751283 分钟前
神经网络控制的多方法融合:PID、模型预测控制(MPC)与自适应策略
人工智能·深度学习·神经网络
青主创享阁4 分钟前
技术破局制造业民企困局:玄晶引擎的AI赋能路径与实践逻辑
人工智能
智慧化智能化数字化方案5 分钟前
数据资产管理进阶——解读数据资产管理体系建设【附全文阅读】
大数据·人工智能·数据资产管理·数据资产管理体系建设·数据要素入表
沛沛老爹6 分钟前
Web开发者快速上手AI Agent:基于Function Calling的12306自动订票系统实战
java·人工智能·agent·web转型
EchoL、9 分钟前
浅谈当下深度生成模型:从VAE、GAN、Diffusion、Flow Matching到世界模型
人工智能·神经网络·生成对抗网络
凤希AI伴侣12 分钟前
深度优化与开源力量-凤希AI伴侣-2026年1月6日
人工智能·凤希ai伴侣
deephub13 分钟前
Agentic RAG:用LangGraph打造会自动修正检索错误的 RAG 系统
人工智能·大语言模型·rag·langgraph
Rabbit_QL14 分钟前
【Pytorch使用】CUDA 显存管理与 OOM 排查实战:以 PyTorch 联邦学习训练为例
人工智能·pytorch·python
坠金17 分钟前
方差、偏差
人工智能·机器学习