Java推荐算法——特征加权推荐算法(以申请学校为例)

加权推荐算法

文章目录


1.推荐算法的简单介绍

众所周知,推荐算法有很多种,例如:

1.加权推荐:分为简单的特征加权,以及复杂的混合加权。主要是将特征以权重进行计算总和,排序出前几名的数据,即最符合条件的数据,推荐给用户。

2.内容基推荐:这种方法基于物品的特征。系统会分析用户过去喜欢的物品特征,然后找到具有类似特征的其他物品推荐给用户。这种方法依赖于对物品内容的深入理解,比如文本、图像或音频特征。

比如我想买【华为手机】,但是系统中关于华为手机的商品很少,在用户继续浏览的过程中,就会根据华为手机属于【手机】类的这个特征,推荐其他【手机】类型的商品。

3.协同过滤推荐 :分为物品基协同过滤用户基协同过滤

简单描述一下【用户基协同过滤】。

如果一个用户A喜欢某个物品,那么这个系统会找到与用户A相似的其他用户B,然后将B喜欢的、A还未接触的物品推荐给A。

2.加权推荐算法详细介绍

本次探讨的就是简单的特征加权 ,以留学申请为例简单描述一下:

比如留学申请的过程中中有几个重要特征参数:所在国家、全球QS排名、专业。

那么当我想选择:{英国,前10,计算机}这样的数据时,一般会怎么查呢?是不是精确查询了?在数据库中找到英国+QS前10+计算机这样的数据返回给用户。

但是在面对数据较少的时候,显示给用户的数据就太少了,比如我上面展示的,只有2条数据符合要求。

那如果我想每次用户搜索完成后,最少都要展示10条数据呢?

这样就需要在精确搜索进行改进了,改为【特征加权推荐 】,以国家、专业、QS排名 三个为特征,设置权重 ,对数据库中的数据进行计算 ,获取前10个得分最高的数据展示。

这样就可以推荐出用户也"可能"喜欢的院校了,比如就推荐出了美国高校的计算机专业。

3.代码实现

实现代码示例如下:

加权推荐的算法部分

首先我们需要准备留学专业的java实体类。

java 复制代码
package com.ride.system.domain;

import org.apache.commons.lang3.builder.ToStringBuilder;
import org.apache.commons.lang3.builder.ToStringStyle;
import com.ride.system.common.core.domain.BaseEntity;

/**
 * 留学专业信息对象 sys_study_abroad
 *
 */
public class SysStudyAbroad extends BaseEntity
{
    private static final long serialVersionUID = 1L;

    /** 主键 */
    private Long studyAbroadId;

    /** 国家 */
    private String country;

	/** 专业 */
    private String major;
    
	/** QS排名 */
    private String qs;

    // 推荐加权得分
    private Double score;

    public Double getScore() {
        return score;
    }

    public void setScore(Double score) {
        this.score = score;
    }

    public String getQs() {
        return qs;
    }

    public void setQs(String qs) {
        this.qs = qs;
    }

    public String getCountry() {
        return country;
    }

    public void setCountry(String country) {
        this.country = country;
    }

    public SysMajor getMajor() {
        return major;
    }

    public void setMajor(SysMajor major) {
        this.major = major;
    }
}

接下来,编写推荐算法的函数

java 复制代码
/**
 * 加权平均推荐算法
 * @param userInput 用户输入
 * @param majors 留学专业列表,即数据库中全部专业数据
 * @param weights 权重规则
 * @return
 */
public static List<SysStudyAbroad> weightedRecommendation(SysStudyAbroad userInput, List<SysStudyAbroad> majors, Map<String, Double> weights) {
    List<SysStudyAbroad> recommendations = new ArrayList<>();

    for (SysStudyAbroad major : majors) {
        double score = 0;

        // 计算每个权重的得分
        // 如果满足一个要求,则得1分,否则0分。
        double countrySimilarity = userInput.getCountry().equals(major.getCountry()) ? 1 : 0;
        double majorSimilarity = userInput.getMajor().equals(major.getMajor()) ? 1 : 0;
        double qsRankSimilarity = Math.abs(Integer.parseInt(userInput.getQs()) - Integer.parseInt(major.getQs())) >= 0 ? 1: 0;

        // 加权得分综合
        score += weights.get("country") * countrySimilarity;
        score += weights.get("major") * majorSimilarity;
        score += weights.get("qsRank") * qsRankSimilarity;
        major.setScore(score);
        recommendations.add(major);
    }

    // 根据加权的得分进行推荐排序
    recommendations.sort((c1, c2) -> Double.compare(c2.getScore(), c1.getScore()));

    return recommendations;
}

在需要调用的地方进行调用

java 复制代码
/**
 * 推荐留学专业信息列表
 *
 * @param sysStudyAbroad 留学专业信息
 * @return 留学专业信息
 */
@Override
public List<SysStudyAbroad> recommend(SysStudyAbroad sysStudyAbroad)
{
	// 查询数据库专业数据
    List<SysStudyAbroad> majors = sysStudyAbroadMapper.selectSysStudyAbroadListAll();
	
	//设置权重值,国家为0.3,专业为0.5,qs排名为0.2
    Map<String, Double> weights = new HashMap<>();
    weights.put("country", 0.3);
    weights.put("major", 0.5);
    weights.put("qsRank", 0.2);
	
    List<SysStudyAbroad> recommendations = weightedRecommendation(sysStudyAbroad, majors, weights);
    recommendations = recommendations.subList(0, Math.min(20, recommendations.size()));
    for (SysStudyAbroad major : recommendations) {
        System.out.println("国家: " + major.getCountry() + ", 专业: " + major.getMajorId() + ", QS排名: " + major.getQs() + ",权重: " + major.getScore());
    }
    return recommendations;
}

用户输入如下

推荐结果如下

4.总结

特征加权推荐算法适用于在用户条件 的基础上推荐额外的内容,适用于有2个特征以上的数据结构。

如有问题,欢迎评论区批评指正!❤️

相关推荐
湫ccc23 分钟前
《Python基础》之字符串格式化输出
开发语言·python
弗拉唐23 分钟前
springBoot,mp,ssm整合案例
java·spring boot·mybatis
oi771 小时前
使用itextpdf进行pdf模版填充中文文本时部分字不显示问题
java·服务器
mqiqe1 小时前
Python MySQL通过Binlog 获取变更记录 恢复数据
开发语言·python·mysql
AttackingLin1 小时前
2024强网杯--babyheap house of apple2解法
linux·开发语言·python
少说多做3431 小时前
Android 不同情况下使用 runOnUiThread
android·java
知兀1 小时前
Java的方法、基本和引用数据类型
java·笔记·黑马程序员
哭泣的眼泪4081 小时前
解析粗糙度仪在工业制造及材料科学和建筑工程领域的重要性
python·算法·django·virtualenv·pygame
蓝黑20202 小时前
IntelliJ IDEA常用快捷键
java·ide·intellij-idea