【论文阅读】PEPNet

目录

  • METHODOLOGY
    • 模型结构
      • [Gate Neural Unit(Gate NU)](#Gate Neural Unit(Gate NU))
      • [Embedding Personalized Network(EPNet)](#Embedding Personalized Network(EPNet))
      • [Parameter Personalized Network(PPNet)](#Parameter Personalized Network(PPNet))
    • 工程优化策略
  • 参考文献

快手23年kdd的一篇文章,涉及到多场景多任务的预估。看之前同事有在模型中使用这个方法,读论文学习一下。

文章链接:https://arxiv.org/abs/2302.01115

METHODOLOGY

模型结构

模型主要分为三部分:

  • 门控神经单元 gate Neural Unit
  • 嵌入个性化网络 EPNet
  • 参数个性化网络 PPNet

Gate Neural Unit(Gate NU)

受LHUC而设计的门控神经单元,作为PPNet和EPNet的基本组成单位

  • LHUC:LHUC专注于学习说话者特定的隐藏单元贡献,它通过用个性化的贡献来扩展模型的隐藏层来提高语音识别的准确性。【即不同的说话者会有相应的门控单元,用于放缩dnn的隐藏层,从而提升语音识别准确性】
  • Gate NU:由两层神经网络组成,其中γ设置为2

    Gate NU 旨在用不同的个性化语义(比如user id、item id等等)来处理更多先前的信息,以注入模型进行更个性化的建模。

Embedding Personalized Network(EPNet)

  • 输入:domain端的特征,比如domain id,每个域中用户行为和物品曝光的计数等。组合上常规的特征嵌入表示(停止梯度传播的)
  • 输出:经过Gate NU后的结果

    得到的结果和 一般特征嵌入表示 E E E进行个性化转化,通过做元素乘积的方式。这样实现在不同域中对一般特征的个性化筛选。

Parameter Personalized Network(PPNet)

核心思想:修改多任务学习中的DNN参数,建立针对每个用户兴趣的DNN模型。

输入:user、item、作者角度的feature(先验知识)。连接上经过EPNet调整过的特征嵌入表示。

输出:经过Gate NU后的结果

对于每一个任务的DNN tower,在DNN的每一层输出上都通过element-wise的方式结合PPNet的输出,也就是PPNet会有DNN layer num个(or 层?),来匹配每一层的输出形状,如图中蓝色所示。

工程优化策略

  • 特征消除策略:设计一个无冲突和记忆效率的全局共享嵌入式表(GSET)。大致思想是这个结构会通过特征得分消除机制,来避免低频feature进入和退出系统,使得特征embedding的空间占有率始终保持一个稳定的阈值范围内。
  • 在线同步策略:两种同步在线模型所需嵌入的策略:1)为每个特征设置数量限制,以防止任何单个特征的嵌入过度同步。2)设置嵌入的过期时间,仅同步到期的嵌入,不同步未达到指定更新频率的嵌入。
  • 离线训练策略:在短视频场景中,嵌入的更新频率高于DNN参数,尤其是ID特征。因此训练时 嵌入层和上层DNN网络采用不同的优化方法和更新策略。

参考文献

  1. https://www.jiqizhixin.com/articles/2021-02-03-6
  2. https://zhuanlan.zhihu.com/p/617478217
  3. https://zhuanlan.zhihu.com/p/4183820183
相关推荐
DuHz3 天前
无线通信与雷达感知融合的波形设计与信号处理——论文阅读(上)
论文阅读·信号处理
DuHz3 天前
无线通信与雷达感知融合的波形设计与信号处理——论文阅读(下)
论文阅读·汽车·信息与通信·信号处理
秋邱3 天前
智启未来:AGI 教育融合 × 跨平台联盟 × 个性化空间,重构教育 AI 新范式开篇:一场 “教育 ×AI” 的范式革命
人工智能·python·重构·推荐算法·agi
张较瘦_4 天前
[论文阅读] AI + 软件工程 | LLM救场Serverless开发!SlsReuse框架让函数复用率飙升至91%,还快了44%
论文阅读·人工智能·软件工程
m0_650108244 天前
InstructBLIP:面向通用视觉语言模型的指令微调技术解析
论文阅读·人工智能·q-former·指令微调的视觉语言大模型·零样本跨任务泛化·通用视觉语言模型
做cv的小昊5 天前
VLM经典论文阅读:【综述】An Introduction to Vision-Language Modeling
论文阅读·人工智能·计算机视觉·语言模型·自然语言处理·bert·transformer
m0_650108245 天前
PaLM-E:具身智能的多模态语言模型新范式
论文阅读·人工智能·机器人·具身智能·多模态大语言模型·palm-e·大模型驱动
B站计算机毕业设计之家6 天前
基于Python音乐推荐系统 数据分析可视化 协同过滤推荐算法 大数据(全套源码+文档)建议收藏✅
python·数据分析·推荐算法
m0_650108246 天前
PaLM:Pathways 驱动的大规模语言模型 scaling 实践
论文阅读·人工智能·palm·谷歌大模型·大规模语言模型·全面评估与行为分析·scaling效应
小殊小殊6 天前
【论文笔记】视频RAG-Vgent:基于图结构的视频检索推理框架
论文阅读·人工智能·深度学习