爬虫学习(三)用beautiful 解析html


安装库



py 复制代码
import  requests
from bs4 import BeautifulSoup
headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"

}
for start_num in range(0,250,25):

    response = requests.get(f"https://movie.douban.com/top250?start={start_num}",headers = headers)
    html = response.text
    soup = BeautifulSoup(html,"html.parser")
    all_title = soup.findAll("span",attrs={"class":"title"})
    for title in all_title:
        title_string = title.string
        if "/" not in title_string:
            print(title_string)
相关推荐
摇滚侠5 小时前
如何选择 nodejs 版本,nodejs 版本号详解
学习
醇氧5 小时前
【学习】IP地址:数字世界的“门牌号”怎么读?
网络协议·学习·tcp/ip
talen_hx2966 小时前
《零基础入门Spark》学习笔记 Day 11
笔记·学习·spark
ZhiqianXia7 小时前
gem5 模拟器学习笔记(1):核心术语整理
笔记·学习
GHL2842710908 小时前
MCP学习
学习·ai
凌波粒8 小时前
D2L学习笔记:安装、张量与数据处理
笔记·python·学习·pandas
chools9 小时前
Java后端拥抱AI开发之个人学习路线 - - Spring AI【第一期】
java·人工智能·学习·spring·ai
忙什么果10 小时前
transformer学习笔记2
笔记·学习·transformer
ZhiqianXia10 小时前
Gem5 学习笔记(2) : Gem5 建模要点与基本思路
笔记·学习