【开题答辩全过程】以 基于协同过滤算法的新闻推荐系统的设计与实现为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

答辩学生:各位老师好,我的题目是"基于协同过滤算法的新闻推荐系统的设计与实现"。系统主要解决信息过载问题,给用户推送个性化新闻。核心功能分三块:先用 Scrapy 爬取新闻并做数据清洗;再用协同过滤算出"猜你喜欢"的 20 条新闻;最后 Django 做 Web 前台,用户登录即可浏览、收藏、评分。技术栈就是 Python+Scrapy+Pandas+Numpy 负责算法,MySQL 存数据,Django 做展示,前端用 Bootstrap 拉快速样式。下面请各位老师提问。


评委老师:为什么选协同过滤而不是深度学习?

答辩学生:深度学习效果好但硬件要求高,我电脑只有 8G 内存,协同过滤代码量少、调试快,适合我这种基础一般的学生先跑通整个流程。


评委老师:数据从哪来?版权怎么考虑?

答辩学生:用 Scrapy 爬取新浪、网易的"科技"频道公开列表,只取标题、摘要和链接,正文跳转到源站,不整站复制,量小且仅用于毕业设计,不商用。


评委老师:用户量不大的冷启动怎么解决?

答辩学生:先给新用户弹 20 条最近 24 h 热门新闻,让他点 5 条以上再算相似度,否则默认按栏目随机推荐,保证首页不空白。


评委老师:用什么指标评价推荐效果?

答辩学生:主要用准确率@10 和点击率,线下再算覆盖率和平均绝对误差 MAE,指标到 0.75 以上我就认为达标。


评委老师:数据库怎么保证数据不丢?

答辩学生:MySQL 开 binlog,每晚 2 点用 mysqldump 全量备份一次,备份文件存到 OneDrive,保留 7 天循环。


评委老师:系统上线后新闻更新频率怎么定?

答辩学生:爬虫每 30 分钟跑一次增量,把新 url 与库里比对,已存在就跳过,保证首页新闻不超过 6 小时。


评委老师:如果推荐结果用户不喜欢,有反馈入口吗?

答辩学生:有"不感兴趣"按钮,点后在推荐日志写负样本,下次计算时权重降一半,实现简单在线学习。


评委老师:xx 同学思路清楚,技术选型贴合实际,问答环节能对答如流,可见对系统细节已有掌握。建议后续把冷启动策略再细化、补充隐私保护说明,论文按时间线推进即可。总体表现良好,开题通过,继续加油。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
小郭团队28 分钟前
2_1_七段式SVPWM (经典算法)算法理论与 MATLAB 实现详解
嵌入式硬件·算法·硬件架构·arm·dsp开发
充值修改昵称37 分钟前
数据结构基础:从二叉树到多叉树数据结构进阶
数据结构·python·算法
Deepoch1 小时前
Deepoc数学大模型:发动机行业的算法引擎
人工智能·算法·机器人·发动机·deepoc·发动机行业
浅念-1 小时前
C语言小知识——指针(3)
c语言·开发语言·c++·经验分享·笔记·学习·算法
Hcoco_me2 小时前
大模型面试题84:是否了解 OpenAI 提出的Clip,它和SigLip有什么区别?为什么SigLip效果更好?
人工智能·算法·机器学习·chatgpt·机器人
BHXDML2 小时前
第九章:EM 算法
人工智能·算法·机器学习
却道天凉_好个秋3 小时前
目标检测算法与原理(三):PyTorch实现迁移学习
pytorch·算法·目标检测
无限进步_3 小时前
【C++】大数相加算法详解:从字符串加法到内存布局的思考
开发语言·c++·windows·git·算法·github·visual studio
C+-C资深大佬3 小时前
C++ 数据类型转换是如何实现的?
开发语言·c++·算法
cwplh3 小时前
DP 优化二:斜率优化 DP
算法·动态规划