软科中国大学排名爬虫+数据可视化

这一期是关于软科中国大学排名的爬虫分析

目标网址:https://www.shanghairanking.cn/rankings/bcur/2024

每页30所学校信息,共20页

点击翻页,你发现网址没有发生变化,说明该页面信息应该是利用js实现动态加载数据的方式展示的,所以我们无法通过 get 传参的方式来切换网页进行爬取。

接下来,按 F12 或者右键选择审查元素,搜索一下清华大学查看网页结构:

这里我们可以看到信息都在一个 payload.js 的文件里,继续查看可以发现这里有590所学校的所有信息,说明网页显示的内容是通过 javascript 解析这个文件动态加载进去的。

那我们只需要解析这个文件就好了,找到各个变量对应的值。

最终爬取到的数据:

完整代码评论区获取

相关推荐
njidf19 小时前
使用Python分析你的Spotify听歌数据
jvm·数据库·python
源码站~19 小时前
基于 Flask 的电影评分与票房关联分析系统
后端·python·flask
2301_7938046919 小时前
数据分析与科学计算
jvm·数据库·python
tlwlmy19 小时前
python excel图片批量拼接导出
前端·python·excel
R-sz19 小时前
坐标转换踩坑实录:UTM → WGS84 → GCJ02 前端后端一致实现
开发语言·前端·python
2301_8166512219 小时前
Python游戏中的碰撞检测实现
jvm·数据库·python
Blurpath住宅代理19 小时前
HTTP与SOCKS5代理深度对比:从协议层到实战选型指南
爬虫·http·静态ip·动态代理·住宅ip·住宅代理
cm65432019 小时前
Python Lambda(匿名函数):简洁之道
jvm·数据库·python
小陈工19 小时前
ModelEngine智能体开发实战:知识库自动生成与多Agent协作
大数据·网络·数据库·人工智能·python·django·异步
小陈工19 小时前
2026年3月23日技术资讯洞察:AI Agent失控,Claude Code引领AI编程新趋势
开发语言·数据库·人工智能·后端·python·性能优化·ai编程