爬虫练习-获取imooc课程目录

代码:

kotlin 复制代码
from bs4 import BeautifulSoup
import requests
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0',
}

id='371'  #课程id
html=requests.get('https://coding.imooc.com/class/chapter/'+id+'.html#Anchor',headers=headers).text
print(html)
soup=BeautifulSoup(html,'lxml')
name=soup.find_all("span", "title_info")
for i in name:
    print(i.text)

效果:

代码分析:

kotlin 复制代码
from bs4 import BeautifulSoup
import requests
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0',
}

引入库

设置请求头

kotlin 复制代码
id='371'  #课程id
html=requests.get('https://coding.imooc.com/class/chapter/'+id+'.html#Anchor',headers=headers).text
print(html)
soup=BeautifulSoup(html,'lxml')

获取网页 使用BeautifulSoup解析

kotlin 复制代码
name=soup.find_all("span", "title_info")
for i in name:
    print(i.text)

获取全部 class为title_info的span标签

循环输出标签的text

相关推荐
你才是向阳花21 小时前
如何用Python实现飞机大战小游戏
开发语言·python·pygame
草莓熊Lotso21 小时前
C++ 方向 Web 自动化测试实战:以博客系统为例,从用例到报告全流程解析
前端·网络·c++·人工智能·后端·python·功能测试
程序员爱钓鱼1 天前
Python编程实战——Python实用工具与库:Pandas数据处理
后端·python·ipython
程序员爱钓鱼1 天前
Python编程实战——Python实用工具与库:Numpy基础
后端·python·面试
程序员霸哥哥1 天前
从零搭建PyTorch计算机视觉模型
人工智能·pytorch·python·计算机视觉
xinxinhenmeihao1 天前
爬虫导致IP被封号了如何解封?
爬虫·网络协议·tcp/ip
晚秋大魔王1 天前
基于python的jlink单片机自动化批量烧录工具
前端·python·单片机
胖哥真不错1 天前
Python基于PyTorch实现多输入多输出进行CNN卷积神经网络回归预测项目实战
pytorch·python·毕业设计·课程设计·毕设·多输入多输出·cnn卷积神经网络回归预测
程序员-小李1 天前
基于PyTorch的动物识别模型训练与应用实战
人工智能·pytorch·python
闲人编程1 天前
Python在网络安全中的应用:编写一个简单的端口扫描器
网络·python·web安全·硬件·端口·codecapsule·扫描器