5. 推荐算法的最基础和最直观的认识

1.性别年龄转换为统一的计量单位

所谓推荐,就是替别人推荐,比如工厂A需要招男员工,希望大家推荐认识的人。那么在这里,就有了推荐的概念,限定条件是男。我们知道,人的性别一般分为男或者女。在这里假设把男用"1"表示,女用"0"表示,那么假设下面有几个人,

很明显的,根据我们的约定可以知道,王、李和杨是男的,符合工厂A的需要。

那么假如工厂还要求年龄在25~30岁之间呢?这时又对年龄也做了限制。如他们的年龄如下:

这样不好看,为了统一计量,我们假设符合条件的年龄为1,不符合条件的年龄为0,则上表变为:

那问题来了,我们界定了性别和年龄的计量单位,如何推荐符合条件的人呢,其实很简单,我们只需要写一个二维的向量X = (1, 1),然后把每个人的性别和年龄看成一个二维的向量,这个几个人的性别和年龄就构成一个矩阵,

我们将矩阵和向量相乘得到

现在我们将这个结果合并到上表中得到下表:

大家发现规律了没有,其实累计的值为2的表示满足工厂A的招工要求,显然,满足招工要求的人是:王、李、杨。

2.多个条件和加权重的计算

2.1多个条件的计算

在第1部分我们推荐了满足2个条件(年龄和性别)的员工,那么如果工程A又加了一些条件呢,比如射高:160~190cm,,体重:50~100kg,假如几个人的个人信息如下表:

我们根据上面的思路,将每个属性符合条件的数据改为1,不符合条件的数据改为0,这时得到下表:

然后我们设一个4维的向量x = (1, 1, 1, 1),上面的4个条件可以得到一个矩阵

我们将矩阵和向量相乘得到

现在我们将这个结果合并到上表中得到下表:

显然,累计值为4的则为满足条件的人,则满足条件的人为王、李。

那么,如果再增加几十个限制属性时,也可以用相同的方法进行计算推荐符合条件的人。

2.2加权重的计算

以上的计算是假设权重相同的条件下进行推荐的,那么现在假设权重不同呢,比如性别、年龄、身高、体重的权重分别为0.4、0.3、0.2、0.1,则计算方式如下:

现在我们将这个结果合并到上表中得到下表:

假如我们将0.7分以上的表示为合格,则满足工厂A录取条件的人为:王、李、杨。

显然,不同权重时,我们也可以做计算,最后得到满足工厂A需要的人。其实,推荐算法就是以此为基础的.推荐算法用到了余弦求相似度,大家可以想想余弦相似度与本文的向量相乘求相似的有什么区别(其实向量乘积就是余弦的向量积的分子),余弦多个分母是为了将不同属性的计量进行归一化,这样才有可比性,否则就没有意义,而本文将不同的属性用了相同的计量方式(0或者1),并且加了权重,所以不需要归一化,即不需要余弦向量积的分母就能达到余弦相似化的效果。当然,实际应用中用余弦相似度更好更广泛一些。

相关推荐
noipp5 小时前
推荐题目:洛谷 P10907 [蓝桥杯 2024 国 B] 蚂蚁开会
c语言·c++·算法·编程·洛谷
程序员二叉5 小时前
【JUC】线程池全套深度详解|参数|流程|拒绝策略|调优|异常处理
java·开发语言·jvm·算法·面试·juc
硅谷秋水5 小时前
面向长上下文自动驾驶的规划对齐Token压缩
人工智能·深度学习·机器学习·计算机视觉·自动驾驶
青山木6 小时前
Hot 100 --- 轮转数组
java·数据结构·算法
徐小夕6 小时前
Loop Engineering 深度解析与实战指南(全网最全)
前端·算法·github
北域码匠7 小时前
SHA-1算法:安全哈希原理与应用解析
算法·c#·哈希算法
手写码匠8 小时前
手写 GraphRAG:从零实现图增强检索增强生成系统
人工智能·深度学习·算法·aigc
装不满的克莱因瓶8 小时前
【自动驾驶领域】学习 Cityscapes 数据集——城市街景语义理解的标准基准
人工智能·pytorch·python·深度学习·学习·机器学习·自动驾驶
BomanGe18 小时前
NSK重载高刚性滚珠丝杠技术详解
经验分享·算法·规格说明书
FL16238631298 小时前
户外垃圾类型检测数据集VOC+YOLO格式4278张10类别
人工智能·yolo·机器学习