DIN模型和SIM模型原理与实践

文章目录

1.DIN模型

原理

  • 计算用户Last N向量的加权平均
  • 权重是候选物品与Last N物品的相似度

缺点

  • 注意力层的计算量正比于n(用户行为序列的长度)
  • 只能记录最近的几百个物品,否则计算量太大
  • 只关心短期兴趣,会遗忘长期兴趣

2.SIM模型

对长期兴趣建模

原理

  • 对用户长期行为记录,n大小可以是几千
  • 对于每个候选物品,在用户Last N记录中快速查找,找到k个相似物品
  • 把Last N变成TopK,然后输入注意力层
  • 计算量从n降到k

算法步骤

1.查找

2.注意力机制

对比DIN,user侧的LastN交互记录 被换成了上一步查找到的TopK交互记录



参考文献

王树森推荐系统公开课-SIM模型
SIM论文
DIN论文

相关推荐
没有不重的名么4 分钟前
门控循环单元GRU
人工智能·深度学习·gru
love_and_hope7 分钟前
Pytorch学习--神经网络--搭建小实战(手撕CIFAR 10 model structure)和 Sequential 的使用
人工智能·pytorch·python·深度学习·学习
学术头条1 小时前
AI 的「phone use」竟是这样练成的,清华、智谱团队发布 AutoGLM 技术报告
人工智能·科技·深度学习·语言模型
孙同学要努力1 小时前
《深度学习》——深度学习基础知识(全连接神经网络)
人工智能·深度学习·神经网络
喵~来学编程啦2 小时前
【论文精读】LPT: Long-tailed prompt tuning for image classification
人工智能·深度学习·机器学习·计算机视觉·论文笔记
-Nemophilist-3 小时前
机器学习与深度学习-1-线性回归从零开始实现
深度学习·机器学习·线性回归
羊小猪~~7 小时前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
软工菜鸡8 小时前
预训练语言模型BERT——PaddleNLP中的预训练模型
大数据·人工智能·深度学习·算法·语言模型·自然语言处理·bert
哔哩哔哩技术9 小时前
B站S赛直播中的关键事件识别与应用
深度学习
deephub9 小时前
Tokenformer:基于参数标记化的高效可扩展Transformer架构
人工智能·python·深度学习·架构·transformer