
这里红框中的均值(3.2、3.4、3.25 ),是 "对物品有过评分的用户的评分均值" ,对应不同物品的评分用户集合
一、公式:均值 = 特定物品的 "已评分用户的评分总和 / 已评分用户数量"
ItemCF 中,计算用户对物品的预测评分时,需要先算出 "与目标物品(物品 5)相似的物品(物品 1、物品 4 )的评分均值" ,用于修正评分偏差。
二、计算物品 1、物品 4、物品 5(目标用户) 的评分均值
1. 物品 1 的评分均值(3.2)
- 哪些用户对物品 1 有评分?Alice、用户 1、用户 2、用户 3、用户 4(看表格第一列,物品 1 的评分行:5、3、4、3、1 )
- 计算:总和 = 5(Alice) + 3(用户 1) + 4(用户 2) + 3(用户 3) + 1(用户 4) = 16数量 = 5(共 5 个用户评分)均值 = 16 / 5 = 3.2
2. 物品 4 的评分均值(3.4)
- 哪些用户对物品 4 有评分?Alice、用户 1、用户 2、用户 3、用户 4(看表格第四列,物品 4 的评分行:4、3、3、5、2 )
- 计算:总和 = 4(Alice) + 3(用户 1) + 3(用户 2) + 5(用户 3) + 2(用户 4) = 17数量 = 5(共 5 个用户评分)均值 = 17 / 5 = 3.4
3. 物品 5 的基准均值(3.25)
- 哪些用户对物品 5 有评分?用户 1、用户 2、用户 3、用户 4(Alice 未评分,看表格第五列:3、5、4、1 )
- 计算:总和 = 3(用户 1) + 5(用户 2) + 4(用户 3) + 1(用户 4) = 13数量 = 4(共 4 个用户评分)均值 = 13 / 4 = 3.25
三、总结
对每个物品,筛选所有给该物品打过分的用户,计算他们的评分平均值,作为该物品的 "评分基准"。这样设计的原因是:不同用户评分习惯不同(有人习惯打高分,有人习惯打低分),用物品的评分均值可以消除这种个体偏差,让推荐更精准