【开题答辩全过程】以 基于大数据的城市租房数据的分析与可视化为例,包含答辩的问题和答案

个人简介

一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等

开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。

感谢大家的关注与支持!

各位老师好,我是22级数据科学与大数据专业的xx同学。我的毕业设计题目是"基于大数据的城市租房数据的分析与可视化"。系统计划用 Python 做爬虫,把贝壳、安居客等网站的租房信息抓下来,存进 MySQL;然后用 Pandas 做清洗、统计和简单预测;最后用 Flask 搭一个 Web 后台,前端用 ECharts 把租金、户型、热门区域等做成大屏可视化。整个系统分四大模块:数据采集与存储、数据处理与分析、数据可视化展示、系统管理。技术栈就是 Python + Flask + MySQL + ECharts,跑在本地 Windows 环境,后期再考虑放到云服务器。陈述完毕,请各位老师提问。


评委老师:为什么选择"租房"这个主题?

答辩学生:因为我自己也在租房,感觉价格不透明,想做个小工具帮同学快速了解行情。


评委老师:你准备爬哪些网站?

答辩学生:先爬贝壳和安居客,字段就是租金、面积、户型、朝向、楼层、地铁站距离这几个。


评委老师:遇到反爬怎么办?

答辩学生:加随机 User-Agent、延时 3-5 秒,如果还被封就手动分批次下,不硬碰。


评委老师:数据存哪里?

答辩学生:MySQL,一张主表存房源明细,再建几张维表放小区、地铁字典,方便后面连表。


评委老师:可视化准备画哪些图?

答辩学生:租金分布直方图、各区县热力地图、户型饼图、租金-面积散点图,四个图放首页大屏。


评委老师:用什么画?

答辩学生:ECharts,官网有现成模板,我把 JSON 数据接口写出来就能直接套。


评委老师:系统管理员能干啥?

答辩学生:可以删脏数据、重置用户密码、看当天爬了多少条,就这三个按钮。


评委老师:预计多久做完?

答辩学生:寒假把爬虫和数据库跑通,开学一个月做可视化,四月底写完论文,五月准备答辩。


评委老师:如果贝壳页面改版了怎么办?

答辩学生:用 XPath 定位,小改就调路径;大改就重新分析页面,最多花一天。


评委老师:你觉得最难的是哪一步?

答辩学生:数据清洗,因为面积、价格字段里可能带"约""元/月"这种汉字,得写正则一点点抠。


评委老师评价:

xx同学选题贴近生活,目标明确,技术路线清晰,工作量适中,符合本科毕业设计要求。建议后续注意两点:一是反爬策略再写细一点,二是可视化配色尽量简洁。整体方案可行,同意开题,按计划推进即可。


以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取

最后

有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。

相关推荐
Biehmltym5 小时前
【AI】09AI Agent LLM → Streaming → Session 记录 的完整链路
大数据·人工智能·elasticsearch
Data-Miner5 小时前
精品PPT | 某制造集团灯塔工厂解决方案
大数据·人工智能·制造
小湘西6 小时前
Elasticsearch 的一些默认配置上下限
java·大数据·elasticsearch
`林中水滴`7 小时前
SeaTunnel vs Flume
大数据·flume
边缘计算社区7 小时前
第12届全球边缘计算大会-精彩瞬间
大数据·人工智能·边缘计算
Zoey的笔记本7 小时前
告别“人机混战”:如何用智能管控实现安全高效协同
大数据·人工智能
奥利文儿8 小时前
【虚拟机】Ubuntu24安装Miniconda3全记录:避坑指南与实践
大数据·数据仓库·人工智能·数据库开发·etl·虚拟机·etl工程师
2401_835302488 小时前
精准测试赋能高端制造!陶瓷基板介电常数测试的核心价值
大数据·人工智能·制造
飞Link8 小时前
【Hadoop】Linux(CentOS7)下安装Hadoop集群
大数据·linux·hadoop·分布式