爬虫学习(三)用beautiful 解析html


安装库



py 复制代码
import  requests
from bs4 import BeautifulSoup
headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"

}
for start_num in range(0,250,25):

    response = requests.get(f"https://movie.douban.com/top250?start={start_num}",headers = headers)
    html = response.text
    soup = BeautifulSoup(html,"html.parser")
    all_title = soup.findAll("span",attrs={"class":"title"})
    for title in all_title:
        title_string = title.string
        if "/" not in title_string:
            print(title_string)
相关推荐
玄米乌龙茶12317 分钟前
项目开发学习笔记
笔记·学习
闫记康1 小时前
Linux学习day3
linux·服务器·学习
阳光九叶草LXGZXJ1 小时前
达梦数据库-学习-52-DmDrs参数介绍(Manager模块)
linux·运维·数据库·sql·学习
吃好睡好便好1 小时前
在Matlab中绘制峰值图
开发语言·学习·算法·matlab·信息可视化
珞瑜·1 小时前
基于Matlab生成黑色火柴人运球 + 起跳 + 投篮动作
学习·matlab
AI原来如此1 小时前
[特殊字符]2026AI Agent入门学习路径
学习·ai·大模型·ai编程
南汁bbj2 小时前
人工智能发展演进与2026年后学习重点:从“调API“到“造Agent“
人工智能·学习
70asunflower2 小时前
计算机中的绝对路径和相对路径
python·学习
wuxinyan1232 小时前
工业级大模型学习之路016:RAG零基础入门教程(第十二篇):实用进阶功能开发
人工智能·python·学习·rag
xuhaoyu_cpp_java2 小时前
Git学习(一)
经验分享·笔记·git·学习