【开题答辩全过程】以 bilibili排行榜的数据分析与可视化为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是xx同学,本次毕业设计的题目是"Bilibili排行榜的数据分析与可视化"。系统主要分三大模块:数据爬取模块(定时抓取B站日/周/月榜)、数据分析模块(热度走势、分区对比、UP主影响力计算)以及可视化模块(折线图、雷达图、词云、排行榜大屏)。技术栈采用Java+Spring Boot做后台,MySQL存数据,ECharts做前端图表,爬虫用Jsoup,调度用Spring Task,整套部署在Windows本地,后期可考虑迁到云服务器。目前已完成基础爬虫与数据库表设计,预计2025年3月完成全部功能,4月撰写论文,5月准备答辩。


评委老师:为什么选择B站排行榜而不是抖音或微博?

答辩学生:B站排行榜结构清晰、字段固定,接口开放度高,爬取难度低,而且我自己是B站重度用户,对分区内容熟悉,方便做后续分析。


评委老师:系统里"数据分析"具体要算哪些指标?

答辩学生:先算最基础的播放量、点赞量、投币量、收藏量四项,再算一个"综合热度分"=播放量×0.4+点赞×0.3+投币×0.2+收藏×0.1,最后用时间序列看热度走势。


评委老师:相关性分析准备怎么做?

答辩学生:用Pearson系数,把"综合热度分"与"视频时长""UP主粉丝数"做两两相关,看看长短视频或粉丝基数对热度影响大不大。


评委老师:数据存在MySQL里,表怎么设计的?

答辩学生:主表叫video,字段有bv号、标题、分区、时长、播放量、点赞、投币、收藏、UP主id、抓取日期;另建一张up主表存id、昵称、粉丝数,两张表用UP主id外键关联。


评委老师:爬取频率怎么定,会不会被封IP?

答辩学生:目前每天凌晨2点跑一次,加3秒随机延时,请求头带浏览器User-Agent,再用本地ADSL拨号,IP变了继续跑,测试一周还没遇到验证码。


评委老师:可视化大屏打算放哪些图?

答辩学生:首页放"日榜Top10横条图",第二屏放"各分区播放量占比饼图",第三屏放"近30天热度折线",最底下加词云显示高频标题关键词。


评委老师:如果B站改版接口变了怎么办?

答辩学生:把解析逻辑单独写成一个工具类,接口一变只改这个类,另外抓下来的原始HTML多留一份备份,方便重新解析。


评委老师:做完这个项目你觉得最大收获会是什么?

答辩学生:先把Java Web整条流程跑通,从爬虫、入库、计算到出图,全部自己串一遍,以后工作中换别的数据源也能快速上手。


评委老师总结:xx同学选题贴近生活,技术路线清晰,指标设计简单实用,问答环节对数据表结构、反爬策略和可视化方案都对答如流。建议下一步把"综合热度分"权重用归一化再校验一次,并补充异常值清洗逻辑。整体来看,开题目标明确,进度可控,同意按此方案继续开展,预祝大家后续顺利。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
cx330上的猫2 小时前
价值1w的数据分析课知识点汇总-excel使用(第一篇)
数据挖掘·数据分析·excel
CodeJourney.3 小时前
SQL提数与数据分析指南
数据库·信息可视化·数据分析
聊聊MES那点事4 小时前
电脑零配件行业MES系统:快速实现全过程信息溯源
信息可视化·数据分析·数据可视化·mes
Hs_QY_FX5 小时前
Python 分类模型评估:从理论到实战(以信用卡欺诈检测为例)
人工智能·python·机器学习·数据挖掘·多分类评估
成为深度学习高手6 小时前
DGCN+informer分类预测模型
人工智能·分类·数据挖掘
max5006008 小时前
多GPU数据并行训练中GPU利用率不均衡问题深度分析与解决方案
人工智能·机器学习·分类·数据挖掘
F_D_Z1 天前
探索性数据分析|概念辨析
数据挖掘·数据分析
搞科研的小刘选手1 天前
2025计算机视觉和影像计算国际学术会议(CVIC 2025)
人工智能·机器学习·计算机视觉·数据挖掘·数字孪生·影像计算·电磁与光学成像
一只专注做软件的湖南人1 天前
亚马逊 SP-API 深度开发:关键字搜索接口的购物意图挖掘与合规竞品分析
大数据·数据挖掘·api
数据智能老司机1 天前
构建 Medallion 架构——构建 Silver 层
大数据·架构·数据分析