【深度学习】多目标融合算法—样本Loss提权

目录

一、引言

二、样本Loss提权

[2.1 技术原理](#2.1 技术原理)

[2.2 技术优缺点](#2.2 技术优缺点)

三、总结


一、引言

在朴素的深度学习ctr预估模型中(如DNN),通常以一个行为为预估目标,比如通过ctr预估点击率。但实际推荐系统业务场景中,更多是多种目标融合的结果,比如视频推荐,会存在视频点击率、视频完整播放率、视频播放时长等多个目标,而多种目标如何更好的融合,在工业界与学术界均有较多内容产出,由于该环节对实际业务影响最为直接,特开此专栏对推荐系统深度学习多目标问题进行讲述。

今天重点介绍"样本Loss提权",该方法通过训练时梯度乘以样本权重实现对其它目标的加权,方法最为简单。

二、样本Loss提权

2.1 技术原理

所有目标使用一个模型,在标注正样本时,考虑多个目标。例如对于点击和播放,在标注正样本时,给予不同的权重,使它们综合体现在模型目标中。如下表,以视频业务为例,每行为一条训练样本,根据业务需要,把点击视频、视频完播、视频时长的权重分别设置为1、3、5。

该方法通过对不同正向行为给予不同权重,将多目标问题转化为单目标问题。本质是保证一个主目标的同时,将其它目标转化为样本权重,通过复制行为的方法改变数据分布,达到优化其它目标的效果。

2.2 技术优缺点

优点:

  • 模型简单:易于理解,仅在训练时通过梯度乘以样本权重实现对其它目标的加权
  • 成本较低:相比于训练多个目标模型再融合,单模型资源及维护成本更低

缺点:

  • 优化周期长:每次调整样本加权系数,都需要重新训练模型至其收敛
  • 跷跷板问题:多个目标之间可能存在相关或互斥的问题,导致一个行为指标提升的同时,另一个指标下降。

三、总结

本文从技术原理和技术优缺点方面对推荐系统深度学习多目标融合的"样本Loss加权"进行简要讲解,本质是对多个样本行为进行复制,以达到对预期指标的强化,具有模型简单,成本较低的优点,但同时优化周期长、多个指标跷跷板问题也是该方法的缺点,业界针对该方法的缺点进行了一系列的升级,专栏中会逐步讲解,期待您的关注。

相关推荐
条tiao条12 分钟前
KMP 算法详解:告别暴力匹配,让字符串匹配 “永不回头”
开发语言·算法
ARM+FPGA+AI工业主板定制专家17 分钟前
基于ARM+FPGA+AI的船舶状态智能监测系统(二)软硬件设计,模拟量,温度等采集与分析
arm开发·人工智能·目标检测·fpga开发
干啥啥不行,秃头第一名17 分钟前
C++20概念(Concepts)入门指南
开发语言·c++·算法
星空下的月光影子20 分钟前
一维CNN在工业过程信号处理与故障预警中的应用
人工智能·机器学习
牛老师讲GIS23 分钟前
技术与责任:AI时代GIS开发中的数据隐私、算法偏见与伦理挑战
人工智能·gis数据·gis数据隐私
zzh9407730 分钟前
Gemini 3.1 Pro 硬核推理优化剖析:思维织锦、动态计算与国内实测
算法
【建模先锋】34 分钟前
创新首发!基于注意力机制优化的高创新故障诊断模型
深度学习·信号处理·故障诊断·特征融合·轴承故障诊断·fft变换·vmd分解
2301_8073671944 分钟前
C++中的解释器模式变体
开发语言·c++·算法
Simon_lca44 分钟前
突破合规瓶颈:ZDHC Supplier to Zero(工厂零排放 - 进阶型)体系全攻略
大数据·网络·人工智能·分类·数据挖掘·数据分析·零售
卧蚕土豆1 小时前
【有啥问啥】Claude Code 安装与使用教程
人工智能