【开题答辩全过程】以 基于Hadoop的新闻推荐系统为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是信息工程学院大数据技术与应用专业的 XX 同学。我的课题是"基于 Hadoop 的新闻推荐系统"。系统用 Python 爬虫每天抓新闻存 Excel,再导入 MySQL;用 Hadoop+Hive 做分布式计算,把结果写回 MySQL;前台用 Vue 给用户看新闻、点赞、收藏并给出个性化推荐,后台用 Flask 让管理员管新闻、用户和公告;推荐算法用入门最友好的"用户协同过滤"。可视化用 ECharts 做看板。整个技术栈就是:Python+Scrapy、Hadoop+Hive、MySQL、Vue、Flask、协同过滤。


评委老师:为什么选 Hadoop,不直接用 MySQL 算数据?

答辩学生:MySQL 单表到百万级就开始慢,我爬的新闻+行为数据预计上千万条,用 Hadoop 可以横向加机器,Hive 写 SQL 一样算,速度还能接受,以后扩容也方便。


评委老师:Hive 会不会太重?就你一个人开发,装得动吗?

答辩学生:我笔记本 16 G 内存,开三台虚拟机最小化部署,只跑通核心流程,演示那天带电脑现场跑,不追求并发,能出结果就行。


评委老师:你说用协同过滤,冷启动怎么解决?

答辩学生:先给新用户推"24 h 热度榜",等他有 5 条以上点击/收藏行为后再切到协同过滤,过渡期用简单规则顶一下。


评委老师:前台 Vue、后台 Flask 你会吗?

答辩学生:Vue 跟着 B 站 10 小时速成课做了小 DEMO,Flask 上学期写过图书管理小项目,代码能复用,遇到问题继续百度。


评委老师:进度怎么安排?

答辩学生:2025 年 3-4 月爬数据搭环境,5 月写完推荐算法和前后台,6 月整论文+演示视频,保证第 18 周交定稿。


评委老师:如果 Hadoop 装了半天装不上,Plan B 是什么?

答辩学生:把数据缩到 50 万条,直接用 MySQL+Python Pandas 算,演示功能不缩水,论文里再把 Hadoop 方案写上,说明"后续可迁移"。


评委老师评价:

XX 同学选题明确,技术路线清晰,能认识到自己基础薄弱并给出"最小可运行"方案,态度务实。建议把"冷启动"和"缩容方案"再细化成两段文字写进论文,后续注意按时提交代码和文档。总体通过,开题报告批准。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
正在走向自律几秒前
大数据时代时序数据库选型指南:为何Apache IoTDB成为物联网场景首
大数据·时序数据库·apache iotdb
虫小宝2 分钟前
京东返利app分布式追踪系统:基于SkyWalking的全链路问题定位
分布式·skywalking
星图易码17 分钟前
星图云开发者平台功能详解 | IoT物联网平台:工业设备全链路智能管控中枢
分布式·物联网·低代码·低代码平台
Justice Young18 分钟前
Hive第五章:Integeration with HBase
大数据·数据仓库·hive·hbase
王五周八19 分钟前
基于 Redis+Redisson 实现分布式高可用编码生成器
数据库·redis·分布式
天远Date Lab19 分钟前
Python金融风控实战:集成天远多头借贷行业风险版API实现共债预警
大数据·python
Justice Young23 分钟前
Hive第三章:HQL的使用
大数据·数据仓库·hive·hadoop
成为你的宁宁30 分钟前
【Zabbix 分布式监控实战指南(附图文教程):Server/Proxy/Agent 三者关系解析 + Proxy 部署、Agent 接入及取数路径验证】
分布式·zabbix
qq_124987075330 分钟前
基于Spring Boot的电影票网上购票系统的设计与实现(源码+论文+部署+安装)
java·大数据·spring boot·后端·spring·毕业设计·计算机毕业设计
无心水32 分钟前
【分布式利器:腾讯TSF】6、TSF可观测性体系建设实战:Java全链路Metrics+Tracing+Logging落地
java·分布式·架构·wpf·分布式利器·腾讯tsf·分布式利器:腾讯tsf