【开题答辩全过程】以 基于Hadoop的新闻推荐系统为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是信息工程学院大数据技术与应用专业的 XX 同学。我的课题是"基于 Hadoop 的新闻推荐系统"。系统用 Python 爬虫每天抓新闻存 Excel,再导入 MySQL;用 Hadoop+Hive 做分布式计算,把结果写回 MySQL;前台用 Vue 给用户看新闻、点赞、收藏并给出个性化推荐,后台用 Flask 让管理员管新闻、用户和公告;推荐算法用入门最友好的"用户协同过滤"。可视化用 ECharts 做看板。整个技术栈就是:Python+Scrapy、Hadoop+Hive、MySQL、Vue、Flask、协同过滤。


评委老师:为什么选 Hadoop,不直接用 MySQL 算数据?

答辩学生:MySQL 单表到百万级就开始慢,我爬的新闻+行为数据预计上千万条,用 Hadoop 可以横向加机器,Hive 写 SQL 一样算,速度还能接受,以后扩容也方便。


评委老师:Hive 会不会太重?就你一个人开发,装得动吗?

答辩学生:我笔记本 16 G 内存,开三台虚拟机最小化部署,只跑通核心流程,演示那天带电脑现场跑,不追求并发,能出结果就行。


评委老师:你说用协同过滤,冷启动怎么解决?

答辩学生:先给新用户推"24 h 热度榜",等他有 5 条以上点击/收藏行为后再切到协同过滤,过渡期用简单规则顶一下。


评委老师:前台 Vue、后台 Flask 你会吗?

答辩学生:Vue 跟着 B 站 10 小时速成课做了小 DEMO,Flask 上学期写过图书管理小项目,代码能复用,遇到问题继续百度。


评委老师:进度怎么安排?

答辩学生:2025 年 3-4 月爬数据搭环境,5 月写完推荐算法和前后台,6 月整论文+演示视频,保证第 18 周交定稿。


评委老师:如果 Hadoop 装了半天装不上,Plan B 是什么?

答辩学生:把数据缩到 50 万条,直接用 MySQL+Python Pandas 算,演示功能不缩水,论文里再把 Hadoop 方案写上,说明"后续可迁移"。


评委老师评价:

XX 同学选题明确,技术路线清晰,能认识到自己基础薄弱并给出"最小可运行"方案,态度务实。建议把"冷启动"和"缩容方案"再细化成两段文字写进论文,后续注意按时提交代码和文档。总体通过,开题报告批准。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
guoji77881 小时前
2026年Gemini 3 Pro vs 豆包2.0深度评测:海外顶流与国产黑马谁更强?
大数据·人工智能·架构
TDengine (老段)1 小时前
TDengine IDMP 组态面板 —— 工具箱
大数据·数据库·时序数据库·tdengine·涛思数据
网络工程小王1 小时前
【大数据技术详解】——Kibana(学习笔记)
大数据·笔记·学习
zxsz_com_cn3 小时前
设备预测性维护方案设计的关键要素
大数据·人工智能
唐天下闻化3 小时前
连锁数字化改造8成翻车?三维避坑实录
大数据
坚持学习前端日记5 小时前
从零开始构建小说推荐智能体 - Coze 本地部署完整教程
大数据·人工智能·数据挖掘
smchaopiao5 小时前
Hive中的排序与分桶技术详解
数据仓库·hive·hadoop
IDIOT___IDIOT6 小时前
关于 git 进行版本管理的时候 gitignore 写入忽略规则而不生效的问题
大数据·git·elasticsearch
不想看见4046 小时前
Git 误删急救手册
大数据·git·elasticsearch