个人简介
一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。
感谢大家的关注与支持!

答辩学生:各位老师好,我是xx同学,我的课题是"基于Spark的电商用户行为分析系统"。系统主要给电商后台用,先做离线算用户画像,再做实时统计广告效果,最后把结果用图表展现出来。功能就三块:基础数据管理、离线行为分析、实时流量监控。技术栈用Spark做计算,HDFS存数据,SpringBoot+MySQL做后台,前端用ECharts画图,Java语言开发。陈述完毕,谢谢老师!
评委老师:为什么选Spark,不直接用Hadoop MapReduce?
答辩学生:MapReduce每一步都要写磁盘,慢;Spark放内存里迭代,跑同样数据快不少,而且内置SQL、流处理模块,后期加功能省事。
评委老师:系统给谁用?具体解决什么痛点?
答辩学生:给中小型电商运营人员。痛点是原来看数据靠Excel,更新慢,广告烧完钱才发现转化率低,系统能实时看到转化率,及时停掉差广告。
评委老师:数据来源是什么?多大体量?
答辩学生:先模拟,用Python脚本生成用户点击、加购、下单日志,一天100万条左右,约2 GB,后续可接公司真实日志。
评委老师:100万条存哪?为什么?
答辩学生:存HDFS,三副本,笔记本伪分布式先顶着,反正开发阶段够用,后期上实验室三台老机器组小集群。
评委老师:怎么清洗这100万条数据?
答辩学生:用Spark Core写Java程序,先过滤字段缺失,再把时间统一成yyyy-MM-dd HH:mm:ss,最后把用户ID和商品ID统一转Long,脏数据直接丢。
评委老师:用户画像怎么"画像"?
答辩学生:先统计近30天每个用户买了几次、点了几类商品,得到"消费频次"和"兴趣类别"两个指标,然后K-means聚成3类:高价值、潜力、低活跃,后台页面直接展示人群饼图。
评委老师:K-means聚3类谁定的?
答辩学生:参考论文也这么干,先定3类,后期看轮廓系数,系数低再改5类,系统里把K写成配置,重启就能改。
评委老师:实时模块怎么做?
答辩学生:用Spark Streaming,3秒一个微批,从Socket读模拟日志,每批算一次广告点击数,结果写MySQL,前端每5秒Ajax刷新折线图。
评委老师:3秒批一次会不会延迟太高?
答辩学生:对毕业设计够用,真上线可改到1秒,代码只改一个参数,老师您放心,架构留了升级空间。
评委老师:前端图表用什么?
答辩学生:ECharts,官网有现成模板,复制过来改字段名,一天就能出来柱状图、饼图、折线图。
评委老师:基础数据管理指哪些?
答辩学生:商品信息、广告位信息、用户信息三张表的增删改查,后台用SpringBoot+MyBatis,页面点"新增商品"弹出框,填完点保存即可。
评委老师:系统怎么部署?
答辩学生:开发都在Windows笔记本,用VMware起三台CentOS,一台NameNode+Spark master,两台DataNode+Worker,毕业演示时带电脑现场起服务。
评委老师:如果VMware崩了怎么办?
答辩学生:早把镜像导出成OVA,十分钟重装,数据库每天mysqldump备份,演示前再测一遍,保证能跑。
评委老师:做完怎么证明系统有效?
答辩学生:用同一批数据,Hive跑一遍统计当基准,再跑我的Spark,用时缩短60%,内存占用多30%,老师看截图即可;实时模块用脚本1分钟发1万条,页面能看到折线实时上涨,证明通路没堵。
评委老师:打算什么时候开始编码?
答辩学生:2025年1月收集完资料,2月写完需求和架构,3-4月编码,5月测试和写论文,6月答辩。
评委老师:参考文献看了几本?
答辩学生:核心看了林子雨《大数据技术原理与应用》和《Spark快速大数据分析》,外加三篇硕士论文,共十来本,都在参考文献里列了。
【评委总结】
评委老师:xx同学选题贴合实际,技术路线清晰,问答环节能讲明白数据来源、处理流程和部署方案,对Spark和HDFS有基本掌握。下一步注意:1.提前把模拟数据生成脚本跑通,确保100万条能顺利导入;2.实时延迟从3秒再压到1秒,演示效果更直观;3.论文里加上系统截图和性能对比表。总体表现良好,开题通过,继续按计划推进。
以上是某同学的毕业设计答辩的过程,如果你现在还没有参加答辩,还是开题阶段,已经选好了题目不知道怎么写开题报告,可以下面找找有没有自己符合自己题目的开题报告内容,列表中的开题报告都是往届真实的开题报告,可发送使用或参考。文末或底部来联xi可免费获取




最后
有时间和有基础的同学,建议自己多花时间找一下资料(开题报告、源码)自己独立完成毕设,需要开题报告内容、源码参考的,可以联xi博主,没有选题的也可以联系我们进行帮你选题、定功能和建议。