1--Swing模型的引入
在 Item CF 召回中,物品的相似度是基于其受众的交集 来衡量的,但当受众的交集局限在一个小圈子时,就会误将两个不相似的物品定义为相似;
Swing 模型引入用户的重合度来判断两个用户是否属于一个小圈子;
overlap(u1, u2) 用来衡量用户 U1 和 U2 的重叠度,重叠度大代表两个人可能来自同一个小圈子,那么他们对相似度的贡献会比较小。重叠度小,说明他们可能不属于同一个小圈子,则他们对相似度的贡献比较大,
使用 overlap(u1, u2) 可以降低小圈子对相似度的影响,alpha是个人工设置的参数,用来防止分母为 0 的情况;