Python爬取微博相册, 批量下载

xpath插件解析到所有图片的url地址

xpath下载地址: https://www.crxsoso.com/webstore/detail/hgimnogjllphhhkhlmebbmlgjoejdpjl

快捷键: Ctrl+Shift+X

不会xpath语法可以看这里: https://www.w3school.com.cn/xpath/xpath_syntax.asp

//div[@class="woo-box-item-inlineBlock"]//img/@src

复制到文本文件中

读取文件中的地址下载保存

py 复制代码
from urllib import request

with open('img_url.txt', 'r') as fp:
    url_list = fp.readlines()
    for i in range(len(url_list)):
        request.urlretrieve(url_list[i], f"../jujingyi-pic/{i}.jpg")

运行代码, 经过几分钟的下载, 就下载好了
文件过多可能会有点久

循环是从0开始, 所以最后一个会是978

相关推荐
MoonBit月兔9 分钟前
年终 Meetup:走进腾讯|AI 原生编程与 Code Agent 实战交流会
大数据·开发语言·人工智能·腾讯云·moonbit
智航GIS15 分钟前
8.2 面向对象
开发语言·python
小小星球之旅23 分钟前
CompletableFuture学习
java·开发语言·学习
蹦蹦跳跳真可爱5891 小时前
Python----大模型(GPT-2模型训练加速,训练策略)
人工智能·pytorch·python·gpt·embedding
xwill*1 小时前
π∗0.6: a VLA That Learns From Experience
人工智能·pytorch·python
kylezhao20191 小时前
C# 语言基础(变量、数据类型、流程控制、面向对象编程)
开发语言·计算机视觉·c#·visionpro
还不秃顶的计科生1 小时前
LeetCode 热题 100第二题:字母易位词分组python版本
linux·python·leetcode
咯哦哦哦哦1 小时前
WSL + ubantu22.04 + 远程桌面闪退+黑屏闪退解决
linux·开发语言
翩若惊鸿_2 小时前
【无标题】
开发语言·c#
weixin_462446232 小时前
exo + tinygrad:Linux 节点设备能力自动探测(NVIDIA / AMD / CPU 安全兜底)
linux·运维·python·安全