DSSM 和 YouTubeDNN 都是比较经典的 U2I 模型。
U2I 召回
U2I 召回也就是 User-to-Item 召回,它基于用户的历史行为以及用户的一些个人信息,对系统中的候选物品进行筛选,挑选出一部分最有可能被用户喜欢的物品,送入推荐模型进行排序和推荐。
DSSM
DSSM 模型又叫双塔模型(全称 Deep Structured Semantic Model),双塔模型上线很方便,User 塔在线计算 User Embedding,Item 塔离线计算 Item embeding,通过向量检索就可以快速进行召回。线上预测的时候,只需要在内存中计算相似度运算即可。
输入层
最下面的 User 侧和 Item 侧特征是输入层。输入层主要的作用是把文本映射到低维向量空间,转化成向量提供给深度学习网络。表示层中间的 DNN 模型可以看成是表示层。
DSSM 模型表示层使用的是 BOW(Bag Of Words)词袋模型,没有考虑词序的信息。不考虑词序其实存在明显的问题,因为一句话可能词相同,但是语义则相差十万八千里,下面这个是表示层的结构图。