Web爬虫-edu_SRC-目标列表爬取

免责声明:本文仅做技术交流与学习...
爬取后,结合暗黑搜索引擎等等进行进一步搜索.

edu_src.py

python 复制代码
import requests, time
from bs4 import BeautifulSoup
for i in range(1, 20):
    url = f'https://src.sjtu.edu.cn/rank/firm/0/?page={i}'
    print(f"正在获取第{i}页数据")
    s = requests.get(url).text
    # print(s)
    soup = BeautifulSoup(s, 'html.parser')
    edu1 = soup.find_all('tr')
    # print(edu1)
    for edu in edu1:
        try:
            edu_name = edu.a.text
            # print(edu_name)
            with open('edu_name.txt', 'a+',encoding='utf-8') as f:
                f.write(edu_name + '\n')
        except:
            pass
    print(f"{i}页已经写入!!!")
相关推荐
!停3 分钟前
深入理解指针(4)
开发语言·javascript·ecmascript
小白狮ww5 分钟前
Matlab 教程:基于 RFUAV 系统使用 Matlab 处理无人机信号
开发语言·人工智能·深度学习·机器学习·matlab·无人机·rfuav
A24207349307 分钟前
JavaScript学习
前端·javascript·学习
奋斗吧程序媛9 分钟前
动态组件驱动的标签页架构(简单来说:一个页面包含许多Tabs页面,这些Tabs页面渲染逻辑)
前端·javascript·vue.js
Felix_Fly10 分钟前
用 Vue3 + naive-cron 开发 Cron 表达式工具:从 0 到 1 实现生成 + 反解析
前端·javascript·vue.js·vue·cron·naive
开发者小天13 分钟前
react中useReducer的使用
前端·javascript·react.js
BoBoZz1914 分钟前
Hello 隐式建模
python·vtk·图形渲染·图形处理
副露のmagic17 分钟前
更弱智的算法学习day 10
python·学习·算法
penngo18 分钟前
Golang使用Fyne开发桌面应用
开发语言·后端·golang
小虎牙00718 分钟前
关于Android Compose架构的思考
android·前端·mvvm