【开题答辩全过程】以 bilibili排行榜的数据分析与可视化为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是xx同学,本次毕业设计的题目是"Bilibili排行榜的数据分析与可视化"。系统主要分三大模块:数据爬取模块(定时抓取B站日/周/月榜)、数据分析模块(热度走势、分区对比、UP主影响力计算)以及可视化模块(折线图、雷达图、词云、排行榜大屏)。技术栈采用Java+Spring Boot做后台,MySQL存数据,ECharts做前端图表,爬虫用Jsoup,调度用Spring Task,整套部署在Windows本地,后期可考虑迁到云服务器。目前已完成基础爬虫与数据库表设计,预计2025年3月完成全部功能,4月撰写论文,5月准备答辩。


评委老师:为什么选择B站排行榜而不是抖音或微博?

答辩学生:B站排行榜结构清晰、字段固定,接口开放度高,爬取难度低,而且我自己是B站重度用户,对分区内容熟悉,方便做后续分析。


评委老师:系统里"数据分析"具体要算哪些指标?

答辩学生:先算最基础的播放量、点赞量、投币量、收藏量四项,再算一个"综合热度分"=播放量×0.4+点赞×0.3+投币×0.2+收藏×0.1,最后用时间序列看热度走势。


评委老师:相关性分析准备怎么做?

答辩学生:用Pearson系数,把"综合热度分"与"视频时长""UP主粉丝数"做两两相关,看看长短视频或粉丝基数对热度影响大不大。


评委老师:数据存在MySQL里,表怎么设计的?

答辩学生:主表叫video,字段有bv号、标题、分区、时长、播放量、点赞、投币、收藏、UP主id、抓取日期;另建一张up主表存id、昵称、粉丝数,两张表用UP主id外键关联。


评委老师:爬取频率怎么定,会不会被封IP?

答辩学生:目前每天凌晨2点跑一次,加3秒随机延时,请求头带浏览器User-Agent,再用本地ADSL拨号,IP变了继续跑,测试一周还没遇到验证码。


评委老师:可视化大屏打算放哪些图?

答辩学生:首页放"日榜Top10横条图",第二屏放"各分区播放量占比饼图",第三屏放"近30天热度折线",最底下加词云显示高频标题关键词。


评委老师:如果B站改版接口变了怎么办?

答辩学生:把解析逻辑单独写成一个工具类,接口一变只改这个类,另外抓下来的原始HTML多留一份备份,方便重新解析。


评委老师:做完这个项目你觉得最大收获会是什么?

答辩学生:先把Java Web整条流程跑通,从爬虫、入库、计算到出图,全部自己串一遍,以后工作中换别的数据源也能快速上手。


评委老师总结:xx同学选题贴近生活,技术路线清晰,指标设计简单实用,问答环节对数据表结构、反爬策略和可视化方案都对答如流。建议下一步把"综合热度分"权重用归一化再校验一次,并补充异常值清洗逻辑。整体来看,开题目标明确,进度可控,同意按此方案继续开展,预祝大家后续顺利。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
小辉懂编程5 小时前
数据分析入门:使用pandas进行数据处理 (数据读取,数据清洗,数据处理,数据可视化)
数据挖掘·数据分析·pandas
祝威廉6 小时前
摘下数据分析的皇冠:机器学习,InfiniSynapse 金融评分卡案例
人工智能·机器学习·金融·数据挖掘·数据分析
祁思妙想6 小时前
数据分析三剑客:NumPy、Pandas、Matplotlib
数据分析·numpy·pandas
SelectDB6 小时前
较 Trino 省 67% 成本,速度快 10 倍,中通快递基于 SelectDB 的湖仓分析架构
数据库·数据分析
asyxchenchong8887 小时前
联合物种分布模型HMSC——深入贝叶斯群落生态学分析,涵盖单物种与多物种建模、环境筛与生物筛解析、时空数据分析及系统发育整合等
经验分享·数据挖掘·数据分析
Katecat996637 小时前
基于显微镜图像的体液细胞分类与异常检测:改进RetinaNet模型实现
人工智能·分类·数据挖掘
deardao7 小时前
【对比语言-图像预训练】SuperCLIP:基于简单分类监督增强的 CLIP 模型
人工智能·分类·数据挖掘
我的offer在哪里7 小时前
开源的音视频元数据分析工具
数据挖掘·数据分析·音视频
q_30238195567 小时前
AI赋能电力大数据挖掘!三大核心模型破解电网运维与负荷预测难题
运维·人工智能·数据挖掘