爬虫学习(三)用beautiful 解析html


安装库



py 复制代码
import  requests
from bs4 import BeautifulSoup
headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"

}
for start_num in range(0,250,25):

    response = requests.get(f"https://movie.douban.com/top250?start={start_num}",headers = headers)
    html = response.text
    soup = BeautifulSoup(html,"html.parser")
    all_title = soup.findAll("span",attrs={"class":"title"})
    for title in all_title:
        title_string = title.string
        if "/" not in title_string:
            print(title_string)
相关推荐
Cat_Rocky6 分钟前
CICD-Git简单学习 操作流程后续补
git·学习
weixin_550083157 分钟前
基于知识图谱的python个性化学习路径推荐系统项目源码
人工智能·学习·知识图谱
魔法阵维护师1 小时前
从零开发游戏需要学习的c#模块,第二十七章(远程攻击 —— 发射子弹)
学习·游戏·c#
一口吃俩胖子1 小时前
【脉宽调制DCDC功率变换学习笔记022】DCDC变换器的稳定性、奈奎斯特准则、增益裕度和相位裕度
笔记·学习
weixin_428005301 小时前
C#调用 AI学习从0开始-第1阶段(基础与工具)-第7天多轮对话记忆
人工智能·学习·c#·多轮对话·千问api调用
oddsand11 小时前
AI应用开发学习步骤-java
java·人工智能·学习
知识分享小能手1 小时前
Flask入门学习教程,从入门到精通,Flask智能租房——列表页 知识点详解(7)
python·学习·flask
吃好睡好便好1 小时前
提取矩阵所有元素
开发语言·学习·线性代数·matlab·矩阵
吃好睡好便好1 小时前
提取矩阵特定多列元素
开发语言·学习·线性代数·matlab·矩阵
z200509302 小时前
【Linux学习】Linux中进程终止和进程等待
linux·学习·操作系统