【开题答辩全过程】以 基于Hadoop的新闻推荐系统为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是信息工程学院大数据技术与应用专业的 XX 同学。我的课题是"基于 Hadoop 的新闻推荐系统"。系统用 Python 爬虫每天抓新闻存 Excel,再导入 MySQL;用 Hadoop+Hive 做分布式计算,把结果写回 MySQL;前台用 Vue 给用户看新闻、点赞、收藏并给出个性化推荐,后台用 Flask 让管理员管新闻、用户和公告;推荐算法用入门最友好的"用户协同过滤"。可视化用 ECharts 做看板。整个技术栈就是:Python+Scrapy、Hadoop+Hive、MySQL、Vue、Flask、协同过滤。


评委老师:为什么选 Hadoop,不直接用 MySQL 算数据?

答辩学生:MySQL 单表到百万级就开始慢,我爬的新闻+行为数据预计上千万条,用 Hadoop 可以横向加机器,Hive 写 SQL 一样算,速度还能接受,以后扩容也方便。


评委老师:Hive 会不会太重?就你一个人开发,装得动吗?

答辩学生:我笔记本 16 G 内存,开三台虚拟机最小化部署,只跑通核心流程,演示那天带电脑现场跑,不追求并发,能出结果就行。


评委老师:你说用协同过滤,冷启动怎么解决?

答辩学生:先给新用户推"24 h 热度榜",等他有 5 条以上点击/收藏行为后再切到协同过滤,过渡期用简单规则顶一下。


评委老师:前台 Vue、后台 Flask 你会吗?

答辩学生:Vue 跟着 B 站 10 小时速成课做了小 DEMO,Flask 上学期写过图书管理小项目,代码能复用,遇到问题继续百度。


评委老师:进度怎么安排?

答辩学生:2025 年 3-4 月爬数据搭环境,5 月写完推荐算法和前后台,6 月整论文+演示视频,保证第 18 周交定稿。


评委老师:如果 Hadoop 装了半天装不上,Plan B 是什么?

答辩学生:把数据缩到 50 万条,直接用 MySQL+Python Pandas 算,演示功能不缩水,论文里再把 Hadoop 方案写上,说明"后续可迁移"。


评委老师评价:

XX 同学选题明确,技术路线清晰,能认识到自己基础薄弱并给出"最小可运行"方案,态度务实。建议把"冷启动"和"缩容方案"再细化成两段文字写进论文,后续注意按时提交代码和文档。总体通过,开题报告批准。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
TTBIGDATA4 小时前
【knox】User: knox is not allowed to impersonate admin
大数据·运维·ambari·hdp·trino·knox·bigtop
紧固视界5 小时前
了解常见紧固件分类标准
大数据·制造·紧固件·上海紧固件展
无忧智库5 小时前
跨国制造企业全球供应链协同平台(SRM+WMS+TMS)数字化转型方案深度解析:打造端到端可视化的“数字供应链“(WORD)
大数据
乐迪信息6 小时前
乐迪信息:AI防爆摄像机在船舶监控的应用
大数据·网络·人工智能·算法·无人机
Hernon6 小时前
AI智能体 - 探索与发现 Clawdbot >> Moltbot
大数据·人工智能·ai智能体·ai开发框架
Mikhail_G7 小时前
Mysql数据库操作指南——排序(零基础篇十)
大数据·数据库·sql·mysql·数据分析
7***n757 小时前
2026年GEO深度评测:AI时代营销新基建的实践者与分化
大数据·人工智能
你才是臭弟弟7 小时前
Amazon S3 和 MinIO (数据湖的选型)
大数据·云原生
露天赏雪7 小时前
Java 高并发编程实战:从线程池到分布式锁,解决生产环境并发问题
java·开发语言·spring boot·分布式·后端·mysql
guizhoumen8 小时前
2026年建站系统推荐及选项指南
大数据·运维·人工智能