软科中国大学排名爬虫+数据可视化

Java开发-楠木2024-08-05 18:48

这一期是关于软科中国大学排名的爬虫分析

目标网址：https://www.shanghairanking.cn/rankings/bcur/2024

每页30所学校信息，共20页

点击翻页，你发现网址没有发生变化，说明该页面信息应该是利用js实现动态加载数据的方式展示的，所以我们无法通过 get 传参的方式来切换网页进行爬取。

接下来，按 F12 或者右键选择审查元素，搜索一下清华大学查看网页结构：

这里我们可以看到信息都在一个 payload.js 的文件里，继续查看可以发现这里有590所学校的所有信息，说明网页显示的内容是通过 javascript 解析这个文件动态加载进去的。

那我们只需要解析这个文件就好了，找到各个变量对应的值。

最终爬取到的数据：

完整代码评论区获取

上一篇：RIP路由协议之网络工程师软考中级

下一篇：leetCode - - - 数组

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI科技热点日报 | 2026年07月01日 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 09Kimi K3 真实体验：全网评价整理，优缺点一次性说清楚 102026 年 AI 大模型 & AI 编程工具实战全总结