【开题答辩全过程】以 基于Hadoop教育平台的设计与实现为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是计算机学院 2021 级 xx 同学。我的题目是"基于 Hadoop 的教育平台的设计与实现"。系统用 Hadoop 做底层,把学生在平台上产生的学习日志、成绩、资源点击等大数据收上来,先存到 HDFS,再用 MapReduce 做离线分析,最后用可视化页面把"学生画像、课程热度、成绩分布"结果展示出来。主要分三大角色:管理员管课程/教师/资源,教师上传课件、布置作业、查看学情,学生在线学习、交作业、看成绩;后台还有一个推荐模块,根据历史行为给学生推视频或习题。技术栈简单:Hadoop-3.3.4 做存储与计算,Hive 做 SQL 统计,SpringBoot+MyBatis 做业务接口,前端用 Vue3,图表用 ECharts,服务器是 CentOS7。下面请各位老师提问。


评委老师:为什么一定要用 Hadoop?用 MySQL 不行吗?

答辩学生:MySQL 放几万条成绩没问题,但平台要攒 4 年所有学生的点击日志,数据量会到百 G 级,MySQL 查聚合非常慢。Hadoop 把表拆块并行算,10 分钟就能跑完全校成绩分布,所以选它。


评委老师:你打算怎么收集"学习行为"数据?

答辩学生:前端埋点,学生点一次视频、做一次测验就发一条 JSON 日志到后台,后台直接用 Flume 推到 HDFS,每天凌晨 0:30 定时跑 MapReduce 清洗。


评委老师:平台最核心的功能是什么?

答辩学生:学情大盘。老师打开页面就能看到自己所教班级平均分、及格率、视频完播率,一眼知道哪一章学生最吃力。


评委老师:如果 Hadoop 集群只有 1 台 8G 内存的老机器,能跑起来吗?

答辩学生:不能。我会用学院实验室的 3 台旧主机搭最小集群:1 台 NameNode8G,2 台 DataNode4G,再关掉副本冗余 3 改 2,这样就能跑通演示。


评委老师:数据安全怎么保证?

答辩学生:两条措施:一是 HDFS 目录做权限,学生和教师只能读自己学院的表;二是用 Spring-Security 做登录拦截,密码用 BCrypt 加密,后台日志脱敏存学号后四位。


评委老师:你进度怎么安排?

答辩学生:2025 年 3 月前把 Hadoop 环境搭完并跑通成绩统计;4 月写完 SpringBoot 接口和前端页面;5 月做性能压测并写论文;5 月底答辩。


评委老师:如果推荐模块推错了资源怎么办?

答辩学生:先上"热门排行榜"保底线,推荐只作为"猜你喜欢"小卡片,不干扰正常学习;后期加人工标签权重,让老师给视频打"重点"标签,算法优先推送带标签资源。


评委老师评价:

xx 同学选题贴合大数据热点,技术路线清晰,功能点抓得准,进度安排也接地气。需要注意的是:一是集群规模小,务必在论文里写明实验环境与真实生产的差距;二是推荐算法目前较粗,后续可把协同过滤的冷启动问题再细化。总体开题可行,同意进入下一阶段。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
冷存储观察1 天前
Gigaom雷达报告反映的非结构化数据管理技术应用趋势
大数据·人工智能·云计算·数据安全·企业数据管理·数据基础设施
培培说证1 天前
2026 高职大数据专业考什么证书对就业有帮助?
大数据
lechcat1 天前
多角色协同巡检流程设计技术教程
大数据·数据库·数据挖掘
jiaozi_zzq1 天前
2026高职大数据与会计专业就业方向与能力发展指南
大数据·职场和发展·数据分析·证书
2301_807288631 天前
MPRPC项目(第11天,zookeeper)
分布式·zookeeper·debian
小王毕业啦1 天前
2024年-全国地级市之间地理距离矩阵数据
大数据·人工智能·数据挖掘·数据分析·社科数据·实证数据·地理距离矩阵
Light601 天前
构建数据要素新纪元:领码SPARK平台驱动的可验证、可交易、可监管数据要素工程体系
分布式·数据治理·数据要素·数据质量·dcmm·领码spark·数据产品化
齐 飞1 天前
Spring Cloud Alibaba快速入门-分布式事务Seata(下)
分布式·spring cloud·微服务
Galaxy~5671 天前
Git常见命令及用法
大数据·git·elasticsearch