【开题答辩全过程】以 基于协同过滤算法的新闻推荐系统的设计与实现为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

答辩学生:各位老师好,我的题目是"基于协同过滤算法的新闻推荐系统的设计与实现"。系统主要解决信息过载问题,给用户推送个性化新闻。核心功能分三块:先用 Scrapy 爬取新闻并做数据清洗;再用协同过滤算出"猜你喜欢"的 20 条新闻;最后 Django 做 Web 前台,用户登录即可浏览、收藏、评分。技术栈就是 Python+Scrapy+Pandas+Numpy 负责算法,MySQL 存数据,Django 做展示,前端用 Bootstrap 拉快速样式。下面请各位老师提问。


评委老师:为什么选协同过滤而不是深度学习?

答辩学生:深度学习效果好但硬件要求高,我电脑只有 8G 内存,协同过滤代码量少、调试快,适合我这种基础一般的学生先跑通整个流程。


评委老师:数据从哪来?版权怎么考虑?

答辩学生:用 Scrapy 爬取新浪、网易的"科技"频道公开列表,只取标题、摘要和链接,正文跳转到源站,不整站复制,量小且仅用于毕业设计,不商用。


评委老师:用户量不大的冷启动怎么解决?

答辩学生:先给新用户弹 20 条最近 24 h 热门新闻,让他点 5 条以上再算相似度,否则默认按栏目随机推荐,保证首页不空白。


评委老师:用什么指标评价推荐效果?

答辩学生:主要用准确率@10 和点击率,线下再算覆盖率和平均绝对误差 MAE,指标到 0.75 以上我就认为达标。


评委老师:数据库怎么保证数据不丢?

答辩学生:MySQL 开 binlog,每晚 2 点用 mysqldump 全量备份一次,备份文件存到 OneDrive,保留 7 天循环。


评委老师:系统上线后新闻更新频率怎么定?

答辩学生:爬虫每 30 分钟跑一次增量,把新 url 与库里比对,已存在就跳过,保证首页新闻不超过 6 小时。


评委老师:如果推荐结果用户不喜欢,有反馈入口吗?

答辩学生:有"不感兴趣"按钮,点后在推荐日志写负样本,下次计算时权重降一半,实现简单在线学习。


评委老师:xx 同学思路清楚,技术选型贴合实际,问答环节能对答如流,可见对系统细节已有掌握。建议后续把冷启动策略再细化、补充隐私保护说明,论文按时间线推进即可。总体表现良好,开题通过,继续加油。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
前端小L1 小时前
贪心算法专题(十):维度权衡的艺术——「根据身高重建队列」
javascript·算法·贪心算法
方得一笔1 小时前
自定义常用的字符串函数(strlen,strcpy,strcmp,strcat)
算法
Xの哲學2 小时前
Linux SMP 实现机制深度剖析
linux·服务器·网络·算法·边缘计算
wuk9982 小时前
使用PCA算法进行故障诊断的MATLAB仿真
算法·matlab
额呃呃2 小时前
二分查找细节理解
数据结构·算法
无尽的罚坐人生2 小时前
hot 100 283. 移动零
数据结构·算法·双指针
永远都不秃头的程序员(互关)2 小时前
C++动态数组实战:从手写到vector优化
c++·算法
水力魔方3 小时前
武理排水管网模拟分析系统应用专题5:模型克隆与并行计算
数据库·c++·算法·swmm
谈笑也风生4 小时前
经典算法题型之排序算法(三)
java·算法·排序算法
大佬,救命!!!5 小时前
对算子shape相关的属性值自动化处理
python·算法·自动化·学习笔记·算子·用例脚本·算子形状