爬虫学习(三)用beautiful 解析html


安装库



py 复制代码
import  requests
from bs4 import BeautifulSoup
headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"

}
for start_num in range(0,250,25):

    response = requests.get(f"https://movie.douban.com/top250?start={start_num}",headers = headers)
    html = response.text
    soup = BeautifulSoup(html,"html.parser")
    all_title = soup.findAll("span",attrs={"class":"title"})
    for title in all_title:
        title_string = title.string
        if "/" not in title_string:
            print(title_string)
相关推荐
吃好睡好便好18 小时前
用while循环语句求和
开发语言·学习·算法·matlab·信息可视化
ゆづき19 小时前
计算机数据存储全解:从底层进制转换到存储介质演进
笔记·学习·生活
小+不通文墨20 小时前
树莓派玩转EMQX的常用指令清单
经验分享·笔记·学习
kdxiaojie21 小时前
U-Boot分析【学习笔记】(12)
linux·笔记·学习
吃好睡好便好21 小时前
用for循环语句求和
开发语言·人工智能·学习·matlab·学习方法
_李小白21 小时前
【C++学习笔记】新特性之inline变量
c++·笔记·学习
aloha_7891 天前
软考信息系统项目管理师错误归纳总结
java·学习
呉師傅1 天前
UPS滴滴告警!如何测量UPS电池内阻【UPS学习】
运维·服务器·网络·学习·电脑
lizhihai_991 天前
股市学习心得-与英伟达核心 PCB 相关的八家关联企业
大数据·人工智能·学习
阳光宅男@李光熠1 天前
【电子通识】贴片电阻上的丝印332、5R6、1502、01C怎么读出阻值?
笔记·学习