爬虫学习(三)用beautiful 解析html


安装库



py 复制代码
import  requests
from bs4 import BeautifulSoup
headers = {
    "User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36 Edg/119.0.0.0"

}
for start_num in range(0,250,25):

    response = requests.get(f"https://movie.douban.com/top250?start={start_num}",headers = headers)
    html = response.text
    soup = BeautifulSoup(html,"html.parser")
    all_title = soup.findAll("span",attrs={"class":"title"})
    for title in all_title:
        title_string = title.string
        if "/" not in title_string:
            print(title_string)
相关推荐
Mabnus30 分钟前
文献分享:一种四价双特异性抗体的功能性和IgG样稳定性、药理学和可开发特性研究
学习
岁月不能老37 分钟前
Linux-Part8-考试(学习Linux第8天)
linux·运维·学习
peter67682 小时前
kvm学习小结
学习
zcyf08093 小时前
kafka理论学习汇总
java·分布式·学习·kafka
*TQK*3 小时前
线性代数——行列式⭐
笔记·学习·线性代数
四夕白告木贞4 小时前
stm32week13
stm32·单片机·嵌入式硬件·学习
九亿AI算法优化工作室&4 小时前
结合大语言模型的机械臂抓取操作学习
人工智能·学习·语言模型·自然语言处理
我想吃余4 小时前
Linux学习笔记(一):Linux下的基本指令
linux·笔记·学习
ayas123196 小时前
数模学习:二,MATLAB的基本语法使用
学习
傻欣6 小时前
代码随想录学习笔记---二叉树
笔记·学习·算法