【开题答辩全过程】以 基于Hadoop的新闻推荐系统为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是信息工程学院大数据技术与应用专业的 XX 同学。我的课题是"基于 Hadoop 的新闻推荐系统"。系统用 Python 爬虫每天抓新闻存 Excel,再导入 MySQL;用 Hadoop+Hive 做分布式计算,把结果写回 MySQL;前台用 Vue 给用户看新闻、点赞、收藏并给出个性化推荐,后台用 Flask 让管理员管新闻、用户和公告;推荐算法用入门最友好的"用户协同过滤"。可视化用 ECharts 做看板。整个技术栈就是:Python+Scrapy、Hadoop+Hive、MySQL、Vue、Flask、协同过滤。


评委老师:为什么选 Hadoop,不直接用 MySQL 算数据?

答辩学生:MySQL 单表到百万级就开始慢,我爬的新闻+行为数据预计上千万条,用 Hadoop 可以横向加机器,Hive 写 SQL 一样算,速度还能接受,以后扩容也方便。


评委老师:Hive 会不会太重?就你一个人开发,装得动吗?

答辩学生:我笔记本 16 G 内存,开三台虚拟机最小化部署,只跑通核心流程,演示那天带电脑现场跑,不追求并发,能出结果就行。


评委老师:你说用协同过滤,冷启动怎么解决?

答辩学生:先给新用户推"24 h 热度榜",等他有 5 条以上点击/收藏行为后再切到协同过滤,过渡期用简单规则顶一下。


评委老师:前台 Vue、后台 Flask 你会吗?

答辩学生:Vue 跟着 B 站 10 小时速成课做了小 DEMO,Flask 上学期写过图书管理小项目,代码能复用,遇到问题继续百度。


评委老师:进度怎么安排?

答辩学生:2025 年 3-4 月爬数据搭环境,5 月写完推荐算法和前后台,6 月整论文+演示视频,保证第 18 周交定稿。


评委老师:如果 Hadoop 装了半天装不上,Plan B 是什么?

答辩学生:把数据缩到 50 万条,直接用 MySQL+Python Pandas 算,演示功能不缩水,论文里再把 Hadoop 方案写上,说明"后续可迁移"。


评委老师评价:

XX 同学选题明确,技术路线清晰,能认识到自己基础薄弱并给出"最小可运行"方案,态度务实。建议把"冷启动"和"缩容方案"再细化成两段文字写进论文,后续注意按时提交代码和文档。总体通过,开题报告批准。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
武子康28 分钟前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康1 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天1 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
初次攀爬者4 天前
ZooKeeper 实现分布式锁的两种方式
分布式·后端·zookeeper
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库5 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟5 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人5 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法