爬虫学习(三)用beautiful 解析html


安装库



py 复制代码
import  requests
from bs4 import BeautifulSoup
headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"

}
for start_num in range(0,250,25):

    response = requests.get(f"https://movie.douban.com/top250?start={start_num}",headers = headers)
    html = response.text
    soup = BeautifulSoup(html,"html.parser")
    all_title = soup.findAll("span",attrs={"class":"title"})
    for title in all_title:
        title_string = title.string
        if "/" not in title_string:
            print(title_string)
相关推荐
CrystalShaw5 小时前
[AI codec]opus-1.6\DRED 编码侧 学习笔记
笔记·学习
张张123y5 小时前
RAG从0到1学习:技术架构、项目实践与面试指南
人工智能·python·学习·面试·架构·langchain·transformer
·醉挽清风·5 小时前
学习笔记—Linux—文件IO
linux·服务器·学习
Accerlator5 小时前
计算机网络学习
学习·计算机网络
星爷AG I6 小时前
14-12 动作序列学习(AGI基础理论)
人工智能·学习·agi
澄澈青空~6 小时前
Unity3D VR 游戏开发 — 技术路线与学习路线完整大纲
学习·vr
想搞艺术的程序员8 小时前
Java Survivor区学习笔记
java·笔记·学习·垃圾回收
吃杠碰小鸡8 小时前
学习英语的思路性问题
学习
-Springer-9 小时前
STM32 学习 —— 个人学习笔记9-2(USART串口数据包 & 串口收发 HEX 及 文本 数据包)
笔记·stm32·学习
会编程的李较瘦9 小时前
【C语言程序设计学习】一、C语法基础
c语言·开发语言·学习