爬虫练习-获取imooc课程目录

代码:

kotlin 复制代码
from bs4 import BeautifulSoup
import requests
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0',
}

id='371'  #课程id
html=requests.get('https://coding.imooc.com/class/chapter/'+id+'.html#Anchor',headers=headers).text
print(html)
soup=BeautifulSoup(html,'lxml')
name=soup.find_all("span", "title_info")
for i in name:
    print(i.text)

效果:

代码分析:

kotlin 复制代码
from bs4 import BeautifulSoup
import requests
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0',
}

引入库

设置请求头

kotlin 复制代码
id='371'  #课程id
html=requests.get('https://coding.imooc.com/class/chapter/'+id+'.html#Anchor',headers=headers).text
print(html)
soup=BeautifulSoup(html,'lxml')

获取网页 使用BeautifulSoup解析

kotlin 复制代码
name=soup.find_all("span", "title_info")
for i in name:
    print(i.text)

获取全部 class为title_info的span标签

循环输出标签的text

相关推荐
UR的出不克几秒前
基于 mitmproxy 的大众点评数据采集实战:自动化抓取景点与评论数据
运维·爬虫·python·自动化
程序员:钧念1 分钟前
机器学习与深度学习的区别
人工智能·python·gpt·深度学习·机器学习
蜜汁小强1 分钟前
macOS 上管理不同版本的python
开发语言·python·macos
luobinrobin5 分钟前
射频测试带界面
python
不脱发的程序猿19 分钟前
使用Python高效对比多个相似的CAN DBC数据
python·单片机·嵌入式硬件·嵌入式
winfredzhang24 分钟前
构建自动化 Node.js 项目管理工具:从文件夹监控到一键联动运行
chrome·python·sqlite·node.js·端口·运行js
AI_567828 分钟前
Airflow“3分钟上手”教程:用Python定义定时数据清洗任务
开发语言·人工智能·python
Aurora-Borealis.38 分钟前
Day 38 GPU训练和call方法
python
Ulyanov38 分钟前
PyVista三维战场仿真实战
开发语言·python·tkinter·pyvista·gui开发
深蓝电商API39 分钟前
Scrapy爬虫部署到Scrapyd服务端详解
爬虫·python·scrapy