DIN模型和SIM模型原理与实践

文章目录

1.DIN模型

原理

  • 计算用户Last N向量的加权平均
  • 权重是候选物品与Last N物品的相似度

缺点

  • 注意力层的计算量正比于n(用户行为序列的长度)
  • 只能记录最近的几百个物品,否则计算量太大
  • 只关心短期兴趣,会遗忘长期兴趣

2.SIM模型

对长期兴趣建模

原理

  • 对用户长期行为记录,n大小可以是几千
  • 对于每个候选物品,在用户Last N记录中快速查找,找到k个相似物品
  • 把Last N变成TopK,然后输入注意力层
  • 计算量从n降到k

算法步骤

1.查找

2.注意力机制

对比DIN,user侧的LastN交互记录 被换成了上一步查找到的TopK交互记录



参考文献

王树森推荐系统公开课-SIM模型
SIM论文
DIN论文

相关推荐
Token炼金师9 小时前
幂律的预言:Kaplan 与 Chinchilla 的算力账本 —— Scaling Laws 与最优配比
人工智能·深度学习·大模型架构·kv cache·scaling laws
Token炼金师12 小时前
算力显存通信的三角博弈:DP/TP/PP/SP、ZeRO、混合精度与稳定性 —— 训练优化四件套
人工智能·深度学习·dp·sp·pp·zero·tp
2601_9516599913 小时前
YOLOv11 改进 - 主干网络 ConvNeXtV2全卷积掩码自编码器网络:轻量级纯卷积架构破解特征坍塌难题,提升特征多样性
深度学习·yolo·计算机视觉
2601_9628464914 小时前
计算机毕业设计之基于大数据加护的国产美妆行业发展状况研究
大数据·人工智能·深度学习·信息可视化·课程设计
极光代码工作室15 小时前
基于YOLO目标检测的智能监控系统
python·深度学习·yolo·机器学习·计算机视觉
zhangfeng113315 小时前
aclnn 完整含义解析 华为昇腾计算库-神经网络算子API(算子开发) acl / aclnn / aclrt 三者区分
人工智能·深度学习·神经网络
2601_9516599916 小时前
YOLOv11 改进 - 下采样 轻量化突破:ADown 下采样让 YOLOv11 参量减、精度升
深度学习·yolo·计算机视觉
卡梅德生物科技小能手16 小时前
卡梅德生物科普:CD94(NKG2A)
人工智能·深度学习
直接冲冲冲17 小时前
61-NIN(补充端侧部署和云端部署的概念)
深度学习
硅谷秋水17 小时前
FATE:面向物理落地机器人课程学习具备主动修复功能且考虑可行性-觉察的闭环任务生成方法
人工智能·深度学习·语言模型·机器人