爬虫学习(三)用beautiful 解析html


安装库



py 复制代码
import  requests
from bs4 import BeautifulSoup
headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"

}
for start_num in range(0,250,25):

    response = requests.get(f"https://movie.douban.com/top250?start={start_num}",headers = headers)
    html = response.text
    soup = BeautifulSoup(html,"html.parser")
    all_title = soup.findAll("span",attrs={"class":"title"})
    for title in all_title:
        title_string = title.string
        if "/" not in title_string:
            print(title_string)
相关推荐
Purple Coder7 小时前
BMS学习经验
学习
经济元宇宙8 小时前
摄影培训行业百科:机构选择与学习路径全解析
大数据·人工智能·学习
じ☆冷颜〃8 小时前
实分析与测度论、复分析、傅里叶分析、泛函分析、凸分析概述.
笔记·学习·数学建模·拓扑学·傅立叶分析
星夜夏空998 小时前
STM32单片机学习(10)——GPIO输入
stm32·单片机·学习
南境十里·墨染春水10 小时前
linux学习进展 shell编程
linux·运维·学习
xwz小王子11 小时前
机器人学习十年进化史——从强化学习到VLA的范式变迁
大数据·学习·机器人
小新同学^O^11 小时前
简单学习 --> WebSocket
java·websocket·网络协议·学习
z2005093013 小时前
【linux学习】linux的基本指令
linux·学习
AOwhisky14 小时前
Docker 学习笔记:镜像分发、容器运行与资源限制
笔记·学习·docker
MediaTea14 小时前
人工智能通识课:机器学习之无监督学习
人工智能·深度学习·学习·机器学习