python爬虫获取豆瓣前top250的标题(简单)

今天是简略的一篇,简单小实验

python 复制代码
import requests
from bs4 import BeautifulSoup

# 模拟浏览器的构成(请求头)
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36 Edg/123.0.0.0"
}

for start_num in range(0,250,25):
    # 获取豆瓣top榜上前250部电影的响应内容
    response = requests.get(f"https://movie.douban.com/top250?start={start_num}", headers=headers)
    html = response.text
    # 传入方法,指定解析器为html.parser"
    soup = BeautifulSoup(html, "html.parser")
    all_titles=soup.findAll("span",attrs={"class":"title"})
    for title in all_titles:
        title_string=title.string
        if "/" not in title_string:
            print(title_string)

读取:

相关推荐
码云数智-大飞6 小时前
Rust的所有权模型如何消除内存安全问题?与C++的RAII有何异同?
开发语言
如意猴6 小时前
【前端】002--怎样制作一个简历界面?
开发语言·前端·javascript
夜珀6 小时前
OpenTiny NEXT 从入门到精通·第 6 篇
开发语言·前端框架
JaydenAI6 小时前
[Python编程思想与技巧-01]我所理解的Python元模型
python·元宇宙·元类·元模型
清水白石0086 小时前
《Python 架构师的自动化哲学:从基础语法到企业级作业调度系统与 Airflow 止损实战》
数据库·python·自动化
仍然.6 小时前
多线程---CAS,JUC组件和线程安全的集合类
java·开发语言
航Hang*6 小时前
VMware vSphere 云平台运维与管理基础——第5章:VMware vSphere 5.5 高级特性
运维·服务器·开发语言·windows·学习·虚拟化
kaico20186 小时前
python操作数据库
开发语言·数据库·python
zhangzeyuaaa6 小时前
Python变量的四种作用域
开发语言·python
范纹杉想快点毕业6 小时前
C语言全能实战教程
c语言·开发语言