Python 爬虫:多进程,多线程爬虫<提高爬取效率>

关于多进程,多线程的知识,请自行查询资料补充· ~~~~~~~~~~~

使用多进程:

在python中,使用多进程需要先导包:

python 复制代码
from threding import Thread


def work(name):

    for i in range(1000):
        print(f"我是线程:{name}, {i}")



if __name__ == "__main__":

    for i in range(10):
        # 创建 十个线程
        t = Thread(target=work, args=(f"线程{i}",))

        t.start()

但是以上不推荐使用,

我们可以模拟一个场景, 例如 你来银行办理业务: 银行提供了5个窗口, 相当于开了5个线程, 而客户就是任务, 如果客户有100个,那么每个人都依次排队去办理业务, 这样我们就要写一个很复杂的检测系统, 所以, 这里直接使用线程池, 使用线程池就可以避免这种情况的发生:

使用线程池可以自动的帮我们来完成检测,调度等操作,我们只需要将任务交给线程池即可。

相关推荐
2601_949818092 小时前
头歌答案--爬虫实战
java·前端·爬虫
ILYT NCTR3 小时前
爬虫学习案例3
爬虫·python·学习
叫我刘同学6 小时前
数据存储:从零开始掌握爬虫数据的持久化存储
爬虫
ftpeak7 小时前
网络爬虫Playwright Python 教程:从入门到实战
开发语言·爬虫·python·playwright
smachao11 小时前
初级爬虫实战——麻省理工学院新闻
爬虫
bitt TRES12 小时前
开源的不需要写代码的爬虫maxun
爬虫·开源
深蓝电商API1 天前
闲鱼商品信息抓取:基于 Frida 的 APP 逆向与数据提取
爬虫·闲鱼
电商API_180079052471 天前
闲鱼商品采集API商品列表API店铺商品API
爬虫·数据挖掘·数据分析
qq_283720051 天前
Python模块精进: urllib 从入门到精通
网络·爬虫·python
wanhengidc1 天前
服务器 数据科技发展
运维·服务器·爬虫·科技·游戏·智能手机