【开题答辩全过程】以 基于Hadoop教育平台的设计与实现为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是计算机学院 2021 级 xx 同学。我的题目是"基于 Hadoop 的教育平台的设计与实现"。系统用 Hadoop 做底层,把学生在平台上产生的学习日志、成绩、资源点击等大数据收上来,先存到 HDFS,再用 MapReduce 做离线分析,最后用可视化页面把"学生画像、课程热度、成绩分布"结果展示出来。主要分三大角色:管理员管课程/教师/资源,教师上传课件、布置作业、查看学情,学生在线学习、交作业、看成绩;后台还有一个推荐模块,根据历史行为给学生推视频或习题。技术栈简单:Hadoop-3.3.4 做存储与计算,Hive 做 SQL 统计,SpringBoot+MyBatis 做业务接口,前端用 Vue3,图表用 ECharts,服务器是 CentOS7。下面请各位老师提问。


评委老师:为什么一定要用 Hadoop?用 MySQL 不行吗?

答辩学生:MySQL 放几万条成绩没问题,但平台要攒 4 年所有学生的点击日志,数据量会到百 G 级,MySQL 查聚合非常慢。Hadoop 把表拆块并行算,10 分钟就能跑完全校成绩分布,所以选它。


评委老师:你打算怎么收集"学习行为"数据?

答辩学生:前端埋点,学生点一次视频、做一次测验就发一条 JSON 日志到后台,后台直接用 Flume 推到 HDFS,每天凌晨 0:30 定时跑 MapReduce 清洗。


评委老师:平台最核心的功能是什么?

答辩学生:学情大盘。老师打开页面就能看到自己所教班级平均分、及格率、视频完播率,一眼知道哪一章学生最吃力。


评委老师:如果 Hadoop 集群只有 1 台 8G 内存的老机器,能跑起来吗?

答辩学生:不能。我会用学院实验室的 3 台旧主机搭最小集群:1 台 NameNode8G,2 台 DataNode4G,再关掉副本冗余 3 改 2,这样就能跑通演示。


评委老师:数据安全怎么保证?

答辩学生:两条措施:一是 HDFS 目录做权限,学生和教师只能读自己学院的表;二是用 Spring-Security 做登录拦截,密码用 BCrypt 加密,后台日志脱敏存学号后四位。


评委老师:你进度怎么安排?

答辩学生:2025 年 3 月前把 Hadoop 环境搭完并跑通成绩统计;4 月写完 SpringBoot 接口和前端页面;5 月做性能压测并写论文;5 月底答辩。


评委老师:如果推荐模块推错了资源怎么办?

答辩学生:先上"热门排行榜"保底线,推荐只作为"猜你喜欢"小卡片,不干扰正常学习;后期加人工标签权重,让老师给视频打"重点"标签,算法优先推送带标签资源。


评委老师评价:

xx 同学选题贴合大数据热点,技术路线清晰,功能点抓得准,进度安排也接地气。需要注意的是:一是集群规模小,务必在论文里写明实验环境与真实生产的差距;二是推荐算法目前较粗,后续可把协同过滤的冷启动问题再细化。总体开题可行,同意进入下一阶段。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
武子康8 小时前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天9 小时前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康2 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
初次攀爬者3 天前
ZooKeeper 实现分布式锁的两种方式
分布式·后端·zookeeper
武子康3 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP4 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库4 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟4 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人4 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
计算机程序猿学长4 天前
大数据毕业设计-基于django的音乐网站数据分析管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
大数据·django·课程设计