【开题答辩全过程】以 基于协同过滤算法的新闻推荐系统的设计与实现为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

答辩学生:各位老师好,我的题目是"基于协同过滤算法的新闻推荐系统的设计与实现"。系统主要解决信息过载问题,给用户推送个性化新闻。核心功能分三块:先用 Scrapy 爬取新闻并做数据清洗;再用协同过滤算出"猜你喜欢"的 20 条新闻;最后 Django 做 Web 前台,用户登录即可浏览、收藏、评分。技术栈就是 Python+Scrapy+Pandas+Numpy 负责算法,MySQL 存数据,Django 做展示,前端用 Bootstrap 拉快速样式。下面请各位老师提问。


评委老师:为什么选协同过滤而不是深度学习?

答辩学生:深度学习效果好但硬件要求高,我电脑只有 8G 内存,协同过滤代码量少、调试快,适合我这种基础一般的学生先跑通整个流程。


评委老师:数据从哪来?版权怎么考虑?

答辩学生:用 Scrapy 爬取新浪、网易的"科技"频道公开列表,只取标题、摘要和链接,正文跳转到源站,不整站复制,量小且仅用于毕业设计,不商用。


评委老师:用户量不大的冷启动怎么解决?

答辩学生:先给新用户弹 20 条最近 24 h 热门新闻,让他点 5 条以上再算相似度,否则默认按栏目随机推荐,保证首页不空白。


评委老师:用什么指标评价推荐效果?

答辩学生:主要用准确率@10 和点击率,线下再算覆盖率和平均绝对误差 MAE,指标到 0.75 以上我就认为达标。


评委老师:数据库怎么保证数据不丢?

答辩学生:MySQL 开 binlog,每晚 2 点用 mysqldump 全量备份一次,备份文件存到 OneDrive,保留 7 天循环。


评委老师:系统上线后新闻更新频率怎么定?

答辩学生:爬虫每 30 分钟跑一次增量,把新 url 与库里比对,已存在就跳过,保证首页新闻不超过 6 小时。


评委老师:如果推荐结果用户不喜欢,有反馈入口吗?

答辩学生:有"不感兴趣"按钮,点后在推荐日志写负样本,下次计算时权重降一半,实现简单在线学习。


评委老师:xx 同学思路清楚,技术选型贴合实际,问答环节能对答如流,可见对系统细节已有掌握。建议后续把冷启动策略再细化、补充隐私保护说明,论文按时间线推进即可。总体表现良好,开题通过,继续加油。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
NAGNIP4 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
颜酱12 小时前
单调栈:从模板到实战
javascript·后端·算法
CoovallyAIHub16 小时前
仿生学突破:SILD模型如何让无人机在电力线迷宫中发现“隐形威胁”
深度学习·算法·计算机视觉
CoovallyAIHub16 小时前
从春晚机器人到零样本革命:YOLO26-Pose姿态估计实战指南
深度学习·算法·计算机视觉
CoovallyAIHub16 小时前
Le-DETR:省80%预训练数据,这个实时检测Transformer刷新SOTA|Georgia Tech & 北交大
深度学习·算法·计算机视觉
CoovallyAIHub16 小时前
强化学习凭什么比监督学习更聪明?RL的“聪明”并非来自算法,而是因为它学会了“挑食”
深度学习·算法·计算机视觉
CoovallyAIHub16 小时前
YOLO-IOD深度解析:打破实时增量目标检测的三重知识冲突
深度学习·算法·计算机视觉
NAGNIP1 天前
轻松搞懂全连接神经网络结构!
人工智能·算法·面试
NAGNIP1 天前
一文搞懂激活函数!
算法·面试
董董灿是个攻城狮1 天前
AI 视觉连载7:传统 CV 之高斯滤波实战
算法