【深度学习】多元物料融合算法(一):量纲对齐常见方法

目录

一、引言

二、量纲对齐常见方法

[2.1 Z-score标准化+Sigmoid归一化](#2.1 Z-score标准化+Sigmoid归一化)

[2.2 Min-Max 归一化](#2.2 Min-Max 归一化)

[2.3 Rank Transformation](#2.3 Rank Transformation)

[2.4 Log Transformation](#2.4 Log Transformation)

[2.5 Robust Scaling](#2.5 Robust Scaling)

3、总结


一、引言

类似抖音、快手、小红书等产品的信息流推荐业务,主要通过信息流广告、信息流直播电商等获得经济收益,对于流量最大的核心推荐系统,或多或少都要承担商业指标,承接特定物料的曝光需求。但是广告、直播电商或其他业务物料,会根据自己的需求进行排序,由于不是一套模型,业务场景数据也不一样,插入物料的量纲与主推荐量纲必定不相同,随之但是的就是无法比较问题,如何将不同的量纲对齐且可比呢,今天介绍常见的几种方法。

二、量纲对齐常见方法

2.1 Z-score标准化+Sigmoid归一化

Z-score标准化将数据转换为均值为0、标准差为1的分布。公式如下:

其中:

  • 是原始数据点
  • 是序列的均值
  • 是序列的标准差

Sigmoid将均值为0、标准差为1的分布转化为值域为0-1的分布。公式为

Z-score+Sigmoid序列合并计算步骤

  1. 对每个序列分别计算均值和标准差。
  2. 对每个数据点应用Z-score公式进行标准化。
  3. 对标准化后的序列采用Simgoid归一化到0-1后,进行比较。

2.2 Min-Max 归一化

Min-Max 归一化将数据线性地转换到一个固定的区间(通常是 [0, 1])。公式如下:

其中:

  • 是原始数据点
  • min是序列的最小值
  • max是序列的最大值

序列合并计算步骤:

  1. 对每个序列分别计算最小值和最大值。
  2. 对每个数据点应用上述公式进行归一化。
  3. 合并归一化后的序列。

2.3 Rank Transformation

Rank Transformation 将数据转换为它们的秩次。公式如下:

序列合并计算步骤:

  1. 对每个序列分别计算每个数据点的秩次。
  2. 合并秩次后的序列。

2.4 Log Transformation

如果数据分布偏斜,可以使用对数变换来压缩数据范围。公式如下:

序列合并计算步骤:

  1. 对每个序列分别应用对数变换。
  2. 合并变换后的序列。

2.5 Robust Scaling

Robust Scaling 使用中位数和四分位距(IQR)进行标准化,适用于存在异常值的数据。公式如下:

  • 是序列的中位数
  • 是序列的四分位距(即第75百分位数减去第25百分位数)

序列合并计算步骤:

  1. 对每个序列分别计算中位数和IQR。
  2. 对每个数据点应用上述公式进行标准化。
  3. 合并标准化后的序列。

3、总结

本文初步介绍了多种将不同量纲的多元物料转换为同一量纲的方法,主要目标就是让不同业务场景的推荐排序结果可以比较,通过公式化的序列转换,快速达到可比的预期,计算效率更高。在实践中,Z-score+Sigmoid方法更为实用。

相关推荐
测试员周周3 小时前
【Appium 系列】第16节-WebView-H5上下文切换 — 混合应用的自动化难点
运维·开发语言·人工智能·功能测试·appium·自动化·测试用例
K姐研究社4 小时前
怎么用AI制作电商口播视频,开拍APP一键生成
人工智能·音视频
LaughingZhu5 小时前
Product Hunt 每日热榜 | 2026-05-21
前端·人工智能·经验分享·chatgpt·html
传说故事5 小时前
【论文阅读】MotuBrain: An Advanced World Action Model for Robot Control
论文阅读·人工智能·具身智能·wam
北京耐用通信6 小时前
全域适配工业场景耐达讯自动化Modbus TCP 转 PROFIBUS 网关轻松实现以太网与现场总线互通
网络·人工智能·网络协议·自动化·信息与通信
火山引擎开发者社区6 小时前
TRAE × 火山引擎 Supabase:为你的 AI 应用装上“数据引擎”
人工智能
weixin_446260856 小时前
[特殊字符] 视觉Transformer (ViT) 原理及性能突破:从CNN到大规模自注意力机制的迁移
深度学习·cnn·transformer
小a彤6 小时前
GE 在 CANN 五层架构中的位置
人工智能·深度学习·transformer
心中有国也有家6 小时前
cann-recipes-infer:昇腾 NPU 推理的“菜谱集合”
经验分享·笔记·学习·算法
前端若水6 小时前
会话管理:创建、切换、删除对话历史
前端·人工智能·python·react.js