【开题答辩全过程】以 基于协同过滤算法的新闻推荐系统的设计与实现为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

答辩学生:各位老师好,我的题目是"基于协同过滤算法的新闻推荐系统的设计与实现"。系统主要解决信息过载问题,给用户推送个性化新闻。核心功能分三块:先用 Scrapy 爬取新闻并做数据清洗;再用协同过滤算出"猜你喜欢"的 20 条新闻;最后 Django 做 Web 前台,用户登录即可浏览、收藏、评分。技术栈就是 Python+Scrapy+Pandas+Numpy 负责算法,MySQL 存数据,Django 做展示,前端用 Bootstrap 拉快速样式。下面请各位老师提问。


评委老师:为什么选协同过滤而不是深度学习?

答辩学生:深度学习效果好但硬件要求高,我电脑只有 8G 内存,协同过滤代码量少、调试快,适合我这种基础一般的学生先跑通整个流程。


评委老师:数据从哪来?版权怎么考虑?

答辩学生:用 Scrapy 爬取新浪、网易的"科技"频道公开列表,只取标题、摘要和链接,正文跳转到源站,不整站复制,量小且仅用于毕业设计,不商用。


评委老师:用户量不大的冷启动怎么解决?

答辩学生:先给新用户弹 20 条最近 24 h 热门新闻,让他点 5 条以上再算相似度,否则默认按栏目随机推荐,保证首页不空白。


评委老师:用什么指标评价推荐效果?

答辩学生:主要用准确率@10 和点击率,线下再算覆盖率和平均绝对误差 MAE,指标到 0.75 以上我就认为达标。


评委老师:数据库怎么保证数据不丢?

答辩学生:MySQL 开 binlog,每晚 2 点用 mysqldump 全量备份一次,备份文件存到 OneDrive,保留 7 天循环。


评委老师:系统上线后新闻更新频率怎么定?

答辩学生:爬虫每 30 分钟跑一次增量,把新 url 与库里比对,已存在就跳过,保证首页新闻不超过 6 小时。


评委老师:如果推荐结果用户不喜欢,有反馈入口吗?

答辩学生:有"不感兴趣"按钮,点后在推荐日志写负样本,下次计算时权重降一半,实现简单在线学习。


评委老师:xx 同学思路清楚,技术选型贴合实际,问答环节能对答如流,可见对系统细节已有掌握。建议后续把冷启动策略再细化、补充隐私保护说明,论文按时间线推进即可。总体表现良好,开题通过,继续加油。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
vibecoding日记15 小时前
双非如何快速入职字节等大厂大模型?真实案例分析:推理优化和投机解码
算法·求职·大模型工程师
yszaygr213818 小时前
Verilog参数化游程编码RLE模块
算法
望易18 小时前
刚设计的大模型架构-双域耦合认知框架
算法·架构
复杂网络1 天前
多个 Claude Code 与多个 Codex 协同工作:设计与实现方案
算法
HjhIron2 天前
面试常客:字符串算法从入门到进阶
算法·面试
吴佳浩2 天前
DeepSeek DSpark:Confidence-Scheduled Speculative Decoding 技术解析
人工智能·算法·deepseek
触底反弹2 天前
🧠 搞懂 Token,才算真正入门大模型——从分词原理到 Embedding 语义实战
javascript·人工智能·算法
vivo互联网技术2 天前
ICLR 2026 | 基于后验采样的图像恢复方法LearnIR:人脸去阴影、去雾
人工智能·算法·aigc
浮生望2 天前
JS字符串与回文算法:从包装类到双指针的面试进阶之路
javascript·算法