软科中国大学排名爬虫+数据可视化

这一期是关于软科中国大学排名的爬虫分析

目标网址:https://www.shanghairanking.cn/rankings/bcur/2024

每页30所学校信息,共20页

点击翻页,你发现网址没有发生变化,说明该页面信息应该是利用js实现动态加载数据的方式展示的,所以我们无法通过 get 传参的方式来切换网页进行爬取。

接下来,按 F12 或者右键选择审查元素,搜索一下清华大学查看网页结构:

这里我们可以看到信息都在一个 payload.js 的文件里,继续查看可以发现这里有590所学校的所有信息,说明网页显示的内容是通过 javascript 解析这个文件动态加载进去的。

那我们只需要解析这个文件就好了,找到各个变量对应的值。

最终爬取到的数据:

完整代码评论区获取

相关推荐
天月风沙3 分钟前
基于机器视觉的实验室器件仓储系统设计——内蒙古自治区国家级大创工程存档
开发语言·python
weixin_4684668538 分钟前
机器学习之决策树新手实战指南
人工智能·python·算法·决策树·机器学习·ai
Hesionberger1 小时前
巧用异或找出唯一数字(多解)
java·数据结构·python·算法·leetcode
hef2881 小时前
Python内置函数从入门到实战:list、open等核心用法全解析
python
七老板的blog1 小时前
【Agent智能体】 任务规划工作流
python·学习·ai·开源
weixin199701080161 小时前
[特殊字符] 【性能提升300%】仿1688首页的Webpack优化全记录(附构建分析Python脚本)
前端·python·webpack
代码小书生1 小时前
getpass,一个安全输入的 Python 库!
开发语言·python·安全
其实防守也摸鱼1 小时前
告别单个变量,用列表和字典批量管理你的 Python 数据
开发语言·网络·软件测试·python·web安全·数据结构,编程教程
海鸥-w1 小时前
前端学习python第二天手敲笔记整理
前端·python·学习
MageGojo1 小时前
10 种主题随机诗词:一个 API 解决小程序的诗词内容源
python·小程序·古诗词·api 接入