商品推荐系统+可视化+2种协同过滤推荐算法 Django框架 大数据毕业设计(附源码+论文)✅

毕业设计:2023-2024年计算机专业毕业设计选题汇总(建议收藏)

毕业设计:2023-2024年最新最全计算机专业毕设选题推荐汇总

🍅**感兴趣的可以先收藏起来,点赞、关注不迷路,大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助同学们顺利毕业 。**🍅

1、项目介绍

技术栈:

python语言、MySQL数据库、Django框架、2种协同过滤推荐算法、Echarts可视化、HTML

协同过滤推荐算法的商品推荐系统可以根据用户的历史行为和用户之间的相似性,帮助用户发现他们可能感兴趣的商品。它是一种基于用户行为的个性化推荐方法,能够提高用户的购买满意度和平台的销售额。

协同过滤推荐算法是一种常用的商品推荐系统算法,它基于用户行为数据和用户之间的相似性来进行推荐。

协同过滤推荐算法的商品推荐系统包括以下几个步骤:

  1. 用户相似度计算:根据用户的行为数据,计算用户之间的相似度。常用的相似度计算方法包括余弦相似度、皮尔逊相关系数等。

  2. 相似用户选择:根据用户相似度,选择与目标用户最相似的一些用户作为邻居用户。

  3. 邻居用户的商品推荐:根据邻居用户的行为数据,预测目标用户对未购买的商品的喜好程度。常用的预测方法包括基于用户的协同过滤和基于物品的协同过滤。

  4. 推荐结果生成:根据预测的喜好程度,生成对目标用户的商品推荐列表。

  5. 结果过滤和排序:对生成的推荐列表进行过滤和排序,以提供最优的推荐结果给用户。

协同过滤推荐算法的商品推荐系统可以根据用户的历史行为和用户之间的相似性,帮助用户发现他们可能感兴趣的商品。它是一种基于用户行为的个性化推荐方法,能够提高用户的购买满意度和平台的销售额。

2、项目界面

(1)系统首页

(2)数据可视化1----柱状图分析

(3)数据可视化2---词云图分析

(4)数据可视化3---饼状图分析

(5)数据可视化4---折线图分析

(6)商品详情页-----双推荐算法

(7)个人信息页面

(8)后台数据管理

3、项目说明

技术栈:

python语言、MySQL数据库、Django框架、2种协同过滤推荐算法、Echarts可视化、HTML

协同过滤推荐算法是一种常用的商品推荐系统算法,它基于用户行为数据和用户之间的相似性来进行推荐。

协同过滤推荐算法的商品推荐系统包括以下几个步骤:

  1. 用户相似度计算:根据用户的行为数据,计算用户之间的相似度。常用的相似度计算方法包括余弦相似度、皮尔逊相关系数等。

  2. 相似用户选择:根据用户相似度,选择与目标用户最相似的一些用户作为邻居用户。

  3. 邻居用户的商品推荐:根据邻居用户的行为数据,预测目标用户对未购买的商品的喜好程度。常用的预测方法包括基于用户的协同过滤和基于物品的协同过滤。

  4. 推荐结果生成:根据预测的喜好程度,生成对目标用户的商品推荐列表。

  5. 结果过滤和排序:对生成的推荐列表进行过滤和排序,以提供最优的推荐结果给用户。

协同过滤推荐算法的商品推荐系统可以根据用户的历史行为和用户之间的相似性,帮助用户发现他们可能感兴趣的商品。它是一种基于用户行为的个性化推荐方法,能够提高用户的购买满意度和平台的销售额。

4、核心代码

python 复制代码
# -*-coding:utf-8-*-
import os

os.environ["DJANGO_SETTINGS_MODULE"] = "recomend.settings"
import django

django.setup()
from shop.models import *
from math import sqrt, pow
import operator
from django.db.models import Subquery, Q, Count


# from django.shortcuts import render,render_to_response
class UserCf:

    # 获得初始化数据
    def __init__(self, all_user):
        self.all_user = all_user

    # 通过用户名获得列表,仅调试使用
    def getItems(self, username1, username2):
        return self.all_user[username1], self.all_user[username2]

    # 计算两个用户的皮尔逊相关系数
    def pearson(self, user1, user2):  # 数据格式为:商品id,浏览此
        sum_xy = 0.0  # user1,user2 每项打分的成绩的累加
        n = 0  # 公共浏览次数
        sum_x = 0.0  # user1 的打分总和
        sum_y = 0.0  # user2 的打分总和
        sumX2 = 0.0  # user1每项打分平方的累加
        sumY2 = 0.0  # user2每项打分平方的累加
        for shop1, score1 in user1.items():
            if shop1 in user2.keys():  # 计算公共的浏览次数
                n += 1
                sum_xy += score1 * user2[shop1]
                sum_x += score1
                sum_y += user2[shop1]
                sumX2 += pow(score1, 2)
                sumY2 += pow(user2[shop1], 2)
        if n == 0:
            # print("p氏距离为0")
            return 0
        molecule = sum_xy - (sum_x * sum_y) / n  # 分子
        denominator = sqrt((sumX2 - pow(sum_x, 2) / n) * (sumY2 - pow(sum_y, 2) / n))  # 分母
        if denominator == 0:
            return 0
        r = molecule / denominator
        return r

    # 计算与当前用户的距离,获得最临近的用户
    def nearest_user(self, current_user, n=1):
        distances = {}
        # 用户,相似度
        # 遍历整个数据集
        for user, rate_set in self.all_user.items():
            # 非当前的用户
            if user != current_user:
                distance = self.pearson(self.all_user[current_user], self.all_user[user])
                # 计算两个用户的相似度
                distances[user] = distance
        closest_distance = sorted(
            distances.items(), key=operator.itemgetter(1), reverse=True
        )
        # 最相似的N个用户
        print("closest user:", closest_distance[:n])
        return closest_distance[:n]

    # 给用户推荐商品
    def recommend(self, username, n=3):
        recommend = {}
        nearest_user = self.nearest_user(username, n)
        for user, score in dict(nearest_user).items():  # 最相近的n个用户
            for shops, scores in self.all_user[user].items():  # 推荐的用户的商品列表
                if shops not in self.all_user[username].keys():  # 当前username没有看过
                    if shops not in recommend.keys():  # 添加到推荐列表中
                        recommend[shops] = scores*score
        # 对推荐的结果按照商品
        # 浏览次数排序
        return sorted(recommend.items(), key=operator.itemgetter(1), reverse=True)


# 基于用户的推荐
def recommend_by_user_id(user_id):
    user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
    current_user = User.objects.get(id=user_id)
    # 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
    # 没有的话,就按照浏览度推荐15个
    if current_user.rate_set.count() == 0:
        if len(user_prefer) != 0:
            shop_list = shop.objects.filter(tags__in=user_prefer)[:15]
        else:
            shop_list = shop.objects.order_by("-num")[:15]
        return shop_list
    # 选取评分最多的10个用户
    users_rate = Rate.objects.values('user').annotate(mark_num=Count('user')).order_by('-mark_num')
    user_ids = [user_rate['user'] for user_rate in users_rate]
    user_ids.append(user_id)
    users = User.objects.filter(id__in=user_ids)#users 为评分最多的10个用户
    all_user = {}
    for user in users:
        rates = user.rate_set.all()#查出10名用户的数据
        rate = {}
        # 用户有给商品打分 在rate和all_user中进行设置
        if rates:
            for i in rates:
                rate.setdefault(str(i.shop.id), i.mark)#填充商品数据
            all_user.setdefault(user.username, rate)
        else:
            # 用户没有为商品打过分,设为0
            all_user.setdefault(user.username, {})

    user_cf = UserCf(all_user=all_user)
    recommend_list = [each[0] for each in user_cf.recommend(current_user.username, 15)]
    shop_list = list(shop.objects.filter(id__in=recommend_list).order_by("-num")[:15])
    other_length = 15 - len(shop_list)
    if other_length > 0:
        fix_list = shop.objects.filter(~Q(rate__user_id=user_id)).order_by('-collect')
        for fix in fix_list:
            if fix not in shop_list:
                shop_list.append(fix)
            if len(shop_list) >= 15:
                break
    return shop_list


# 计算相似度
def similarity(shop1_id, shop2_id):
    shop1_set = Rate.objects.filter(shop_id=shop1_id)
    # shop1的打分用户数
    shop1_sum = shop1_set.count()
    # shop_2的打分用户数
    shop2_sum = Rate.objects.filter(shop_id=shop2_id).count()
    # 两者的交集
    common = Rate.objects.filter(user_id__in=Subquery(shop1_set.values('user_id')), shop=shop2_id).values('user_id').count()
    # 没有人给当前商品打分
    if shop1_sum == 0 or shop2_sum == 0:
        return 0
    similar_value = common / sqrt(shop1_sum * shop2_sum)#余弦计算相似度
    return similar_value


#基于物品
def recommend_by_item_id(user_id, k=15):
    # 前三的tag,用户评分前三的商品
    user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
    user_prefer = list(user_prefer)[:3]
    print('user_prefer', user_prefer)
    current_user = User.objects.get(id=user_id)
    # 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
    # 没有的话,就按照浏览度推荐15个
    if current_user.rate_set.count() == 0:
        if len(user_prefer) != 0:
            shop_list = shop.objects.filter(tags__in=user_prefer)[:15]
        else:
            shop_list = shop.objects.order_by("-num")[:15]
        print('from here')
        return shop_list
    # most_tags = Tags.objects.annotate(tags_sum=Count('name')).order_by('-tags_sum').filter(shop__rate__user_id=user_id).order_by('-tags_sum')
    # 选用户最喜欢的标签中的商品,用户没看过的30部,对这30部商品,计算距离最近
    un_watched = shop.objects.filter(~Q(rate__user_id=user_id), tags__in=user_prefer).order_by('?')[:30]  # 看过的商品
    watched = Rate.objects.filter(user_id=user_id).values_list('shop_id', 'mark')
    distances = []
    names = []
    # 在未看过的商品中找到
    for un_watched_shop in un_watched:
        for watched_shop in watched:
            if un_watched_shop not in names:
                names.append(un_watched_shop)
                distances.append((similarity(un_watched_shop.id, watched_shop[0]) * watched_shop[1], un_watched_shop))#加入相似的商品
    distances.sort(key=lambda x: x[0], reverse=True)
    print('this is distances', distances[:15])
    recommend_list = []
    for mark, shop in distances:
        if len(recommend_list) >= k:
            break
        if shop not in recommend_list:
            recommend_list.append(shop)
    # print('this is recommend list', recommend_list)
    # 如果得不到有效数量的推荐 按照未看过的商品中的热度进行填充
    print('recommend list', recommend_list)
    return recommend_list


if __name__ == '__main__':
    # similarity(2003, 2008)
    print(recommend_by_item_id(1799))

5、源码获取方式

🍅由于篇幅限制,获取完整文章或源码、代做项目的,查看我的【用户名】、【专栏名称】、【顶部选题链接】就可以找到我啦🍅

感兴趣的可以先收藏起来,点赞、关注不迷路,下方查看 👇🏻获取联系方式👇🏻

相关推荐
lzhlizihang13 分钟前
【Hive sql 面试题】求出各类型专利top 10申请人,以及对应的专利申请数(难)
大数据·hive·sql·面试题
Tianyanxiao17 分钟前
如何利用探商宝精准营销,抓住行业机遇——以AI技术与大数据推动企业信息精准筛选
大数据·人工智能·科技·数据分析·深度优先·零售
大数据编程之光18 分钟前
Hive 查询各类型专利 top10 申请人及专利申请数
大数据·数据仓库·hive·hadoop
进击的六角龙43 分钟前
Python中处理Excel的基本概念(如工作簿、工作表等)
开发语言·python·excel
GDDGHS_1 小时前
大数据工具 flume 的安装配置与使用 (详细版)
大数据·flume
一只爱好编程的程序猿1 小时前
Java后台生成指定路径下创建指定名称的文件
java·python·数据下载
Aniay_ivy1 小时前
深入探索 Java 8 Stream 流:高效操作与应用场景
java·开发语言·python
gonghw4031 小时前
DearPyGui学习
python·gui
向阳12181 小时前
Bert快速入门
人工智能·python·自然语言处理·bert
engchina1 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j