爬虫练习-获取imooc课程目录

代码:

kotlin 复制代码
from bs4 import BeautifulSoup
import requests
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0',
}

id='371'  #课程id
html=requests.get('https://coding.imooc.com/class/chapter/'+id+'.html#Anchor',headers=headers).text
print(html)
soup=BeautifulSoup(html,'lxml')
name=soup.find_all("span", "title_info")
for i in name:
    print(i.text)

效果:

代码分析:

kotlin 复制代码
from bs4 import BeautifulSoup
import requests
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0',
}

引入库

设置请求头

kotlin 复制代码
id='371'  #课程id
html=requests.get('https://coding.imooc.com/class/chapter/'+id+'.html#Anchor',headers=headers).text
print(html)
soup=BeautifulSoup(html,'lxml')

获取网页 使用BeautifulSoup解析

kotlin 复制代码
name=soup.find_all("span", "title_info")
for i in name:
    print(i.text)

获取全部 class为title_info的span标签

循环输出标签的text

相关推荐
智航GIS1 分钟前
ArcGIS大师之路500技---048计算流水号
python·arcgis
yongche_shi3 分钟前
第九十九篇:Python在其他领域的应用:游戏开发、物联网、AIoT简介
开发语言·python·物联网·游戏开发·aiot
技术工小李20 分钟前
大屏平板签到,为格恩半导体会议注入高效新体验
python
kobe_OKOK_22 分钟前
Django缓存接口数据
python·缓存·django
昔时扬尘处22 分钟前
【题外话】台式机配件选型与组装流程
python·电脑·台式机
小鸡吃米…23 分钟前
带 Python 的人工智能——神经网络
人工智能·python·神经网络
谅望者31 分钟前
数据分析笔记15:Python模块、包与异常处理
开发语言·人工智能·python
2301_7811435631 分钟前
python学习(一)
python·学习
lbb 小魔仙33 分钟前
FP8魔力解锁:SD3.5 图像编辑、修复与增强全栈实战
人工智能·python·ai
爱学习的小道长35 分钟前
Ubuntu Python 使用 Redis 缓存
python·ubuntu·缓存