机器学习排序方法

一、单文档方法(Pointwise)

处理对象是单一文档,将文档转换为特征向量后,将排序问题转化为机器学习中常规的分类或回归问题。CTR方法是单文档方法的典型应用,相对比较成熟,广泛应用于广告、搜索、推荐中。y=f(x),其中y属于[0,1],y的值越大表示用户点击率越高。

样本之间互不影响

二、文档对方法(Pairwise)

相比于单文档方法,文档对方法将重点转向文档顺序关系,是目前相对比较流行的方法。其输入是文档对,输出是局部的优先顺序,主要是将排序问题转化为二分类问题。对于同一query的相关文档集中,任何两个不同标记的文档都可以组成一个训练实例(di,dj),如果di>dj,则赋值为1,视为正例;反之赋值为-1(或者0),视为负例,这样就得到二分类模型所需的训练样本。预测时可以得到所有文档的偏序关系,从而实现排序。

文档之间先后循序相互影响。

三、文档列表方法(Listwise)

把每个查询对应的所有搜索结果列表作为一个训练样例。根据训练样例训练得到的最优评分函数F,评分函数F对每个文档打分,然后根据得分由高到低排序,得到最终的排序结果。

相关推荐
珂朵莉MM32 分钟前
2024 睿抗机器人开发者大赛CAIP-编程技能赛-专科组(国赛)解题报告 | 珂学家
开发语言·人工智能·算法·leetcode·职场和发展·深度优先·图论
ㄣ知冷煖★1 小时前
【论文阅读】A Survey on Multimodal Large Language Models
人工智能·语言模型·自然语言处理
视觉语言导航1 小时前
兼顾长、短视频任务的无人机具身理解!AirVista-II:面向动态场景语义理解的无人机具身智能体系统
人工智能·无人机·具身智能
墨绿色的摆渡人2 小时前
pytorch小记(二十二):全面解读 PyTorch 的 `torch.cumprod`——累积乘积详解与实战示例
人工智能·pytorch·python
moonsims2 小时前
低空态势感知:基于AI的DAA技术是低空飞行的重要安全保障-机载端&地面端
人工智能·安全
若叶时代2 小时前
数据分析_Python
人工智能·python·数据分析
虾球xz2 小时前
游戏引擎学习第286天:开始解耦实体行为
c++·人工智能·学习·游戏引擎
武子康2 小时前
大语言模型 11 - 从0开始训练GPT 0.25B参数量 MiniMind2 准备数据与训练模型 DPO直接偏好优化
人工智能·gpt·ai·语言模型·自然语言处理
羽凌寒3 小时前
图像对比度调整(局域拉普拉斯滤波)
人工智能·计算机视觉
大模型铲屎官3 小时前
【Python-Day 14】玩转Python字典(上篇):从零开始学习创建、访问与操作
开发语言·人工智能·pytorch·python·深度学习·大模型·字典