【开题答辩全过程】以 基于Hadoop的新闻推荐系统为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是信息工程学院大数据技术与应用专业的 XX 同学。我的课题是"基于 Hadoop 的新闻推荐系统"。系统用 Python 爬虫每天抓新闻存 Excel,再导入 MySQL;用 Hadoop+Hive 做分布式计算,把结果写回 MySQL;前台用 Vue 给用户看新闻、点赞、收藏并给出个性化推荐,后台用 Flask 让管理员管新闻、用户和公告;推荐算法用入门最友好的"用户协同过滤"。可视化用 ECharts 做看板。整个技术栈就是:Python+Scrapy、Hadoop+Hive、MySQL、Vue、Flask、协同过滤。


评委老师:为什么选 Hadoop,不直接用 MySQL 算数据?

答辩学生:MySQL 单表到百万级就开始慢,我爬的新闻+行为数据预计上千万条,用 Hadoop 可以横向加机器,Hive 写 SQL 一样算,速度还能接受,以后扩容也方便。


评委老师:Hive 会不会太重?就你一个人开发,装得动吗?

答辩学生:我笔记本 16 G 内存,开三台虚拟机最小化部署,只跑通核心流程,演示那天带电脑现场跑,不追求并发,能出结果就行。


评委老师:你说用协同过滤,冷启动怎么解决?

答辩学生:先给新用户推"24 h 热度榜",等他有 5 条以上点击/收藏行为后再切到协同过滤,过渡期用简单规则顶一下。


评委老师:前台 Vue、后台 Flask 你会吗?

答辩学生:Vue 跟着 B 站 10 小时速成课做了小 DEMO,Flask 上学期写过图书管理小项目,代码能复用,遇到问题继续百度。


评委老师:进度怎么安排?

答辩学生:2025 年 3-4 月爬数据搭环境,5 月写完推荐算法和前后台,6 月整论文+演示视频,保证第 18 周交定稿。


评委老师:如果 Hadoop 装了半天装不上,Plan B 是什么?

答辩学生:把数据缩到 50 万条,直接用 MySQL+Python Pandas 算,演示功能不缩水,论文里再把 Hadoop 方案写上,说明"后续可迁移"。


评委老师评价:

XX 同学选题明确,技术路线清晰,能认识到自己基础薄弱并给出"最小可运行"方案,态度务实。建议把"冷启动"和"缩容方案"再细化成两段文字写进论文,后续注意按时提交代码和文档。总体通过,开题报告批准。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
小钻风33663 小时前
Kafka 零基础实操命令大全
分布式·kafka
程序猿追4 小时前
在 HarmonyOS 模拟器上种出斐波那契螺旋线
大数据·人工智能·microsoft·华为·harmonyos
霸道流氓气质6 小时前
Redisson 看门狗机制详解:分布式锁如何自动续期防止提前过期
分布式·redisson·看门狗
玄米乌龙茶1236 小时前
LLM成长笔记(十二):质量评估与可观测性
大数据·人工智能·笔记
oo哦哦7 小时前
星链引擎矩阵系统深度解析:AI驱动下的全域智能营销SaaS新范式
大数据·人工智能·矩阵
oo哦哦7 小时前
轻量化内容中台如何破解企业矩阵运营困局?以星链引擎为例的技术解析
大数据·人工智能·矩阵
weixin_408318049 小时前
教育行业直播系统搭建指南
java·大数据·数据库
呆码科技9 小时前
适配多业态需求:零售、批发、跨境商贸的物流软件
大数据
东北甜妹9 小时前
Prometheus
大数据
小宋10219 小时前
Tycoon AI 新手快速上手指南
java·大数据·人工智能