【开题答辩全过程】以 基于协同过滤算法的新闻推荐系统的设计与实现为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

答辩学生:各位老师好,我的题目是"基于协同过滤算法的新闻推荐系统的设计与实现"。系统主要解决信息过载问题,给用户推送个性化新闻。核心功能分三块:先用 Scrapy 爬取新闻并做数据清洗;再用协同过滤算出"猜你喜欢"的 20 条新闻;最后 Django 做 Web 前台,用户登录即可浏览、收藏、评分。技术栈就是 Python+Scrapy+Pandas+Numpy 负责算法,MySQL 存数据,Django 做展示,前端用 Bootstrap 拉快速样式。下面请各位老师提问。


评委老师:为什么选协同过滤而不是深度学习?

答辩学生:深度学习效果好但硬件要求高,我电脑只有 8G 内存,协同过滤代码量少、调试快,适合我这种基础一般的学生先跑通整个流程。


评委老师:数据从哪来?版权怎么考虑?

答辩学生:用 Scrapy 爬取新浪、网易的"科技"频道公开列表,只取标题、摘要和链接,正文跳转到源站,不整站复制,量小且仅用于毕业设计,不商用。


评委老师:用户量不大的冷启动怎么解决?

答辩学生:先给新用户弹 20 条最近 24 h 热门新闻,让他点 5 条以上再算相似度,否则默认按栏目随机推荐,保证首页不空白。


评委老师:用什么指标评价推荐效果?

答辩学生:主要用准确率@10 和点击率,线下再算覆盖率和平均绝对误差 MAE,指标到 0.75 以上我就认为达标。


评委老师:数据库怎么保证数据不丢?

答辩学生:MySQL 开 binlog,每晚 2 点用 mysqldump 全量备份一次,备份文件存到 OneDrive,保留 7 天循环。


评委老师:系统上线后新闻更新频率怎么定?

答辩学生:爬虫每 30 分钟跑一次增量,把新 url 与库里比对,已存在就跳过,保证首页新闻不超过 6 小时。


评委老师:如果推荐结果用户不喜欢,有反馈入口吗?

答辩学生:有"不感兴趣"按钮,点后在推荐日志写负样本,下次计算时权重降一半,实现简单在线学习。


评委老师:xx 同学思路清楚,技术选型贴合实际,问答环节能对答如流,可见对系统细节已有掌握。建议后续把冷启动策略再细化、补充隐私保护说明,论文按时间线推进即可。总体表现良好,开题通过,继续加油。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
智者知已应修善业4 小时前
【51单片机LED闪烁10次数码管显示0-9】2023-12-14
c++·经验分享·笔记·算法·51单片机
智者知已应修善业4 小时前
【51单片机2按键控制1个敞亮LED灯闪烁和熄灭】2023-11-3
c++·经验分享·笔记·算法·51单片机
AI算法沐枫5 小时前
大模型 | 大模型之机器学习基本理论
人工智能·python·神经网络·学习·算法·机器学习·计算机视觉
吃着火锅x唱着歌5 小时前
LeetCode 1019.链表中的下一个更大节点
算法·leetcode·链表
凌波粒5 小时前
LeetCode--404.左叶子之和(二叉树)
算法·leetcode·职场和发展
paeamecium5 小时前
【PAT甲级真题】- A+B in Hogwarts
c++·算法·pat考试·pat
青山师5 小时前
二叉树与BST深度解析:遍历算法与平衡策略
数据结构·算法·面试·二叉树·算法与数据结构·java面试·数据结构与算法分析
绝知此事6 小时前
【算法突围 03】核心算法思想:分治/递归/动态规划与 LeetCode 高频真题解析
算法·leetcode·面试·动态规划
AI科技星6 小时前
第二章 平行素数对网格:矩形→等腰梯形拓扑变换(完整公理终稿)
c语言·开发语言·线性代数·算法·量子计算·agi