Python 爬虫:多进程,多线程爬虫<提高爬取效率>

关于多进程,多线程的知识,请自行查询资料补充· ~~~~~~~~~~~

使用多进程:

在python中,使用多进程需要先导包:

python 复制代码
from threding import Thread


def work(name):

    for i in range(1000):
        print(f"我是线程:{name}, {i}")



if __name__ == "__main__":

    for i in range(10):
        # 创建 十个线程
        t = Thread(target=work, args=(f"线程{i}",))

        t.start()

但是以上不推荐使用,

我们可以模拟一个场景, 例如 你来银行办理业务: 银行提供了5个窗口, 相当于开了5个线程, 而客户就是任务, 如果客户有100个,那么每个人都依次排队去办理业务, 这样我们就要写一个很复杂的检测系统, 所以, 这里直接使用线程池, 使用线程池就可以避免这种情况的发生:

使用线程池可以自动的帮我们来完成检测,调度等操作,我们只需要将任务交给线程池即可。

相关推荐
qq_402605655 小时前
python爬虫(二) ---- JS动态渲染数据抓取
javascript·爬虫·python
浔川python社15 小时前
《网络爬虫技术规范与应用指南系列》(xc—5)完
爬虫·python
深蓝电商API19 小时前
爬虫的道德与法律边界:Robots 协议、版权与个人信息保护
爬虫
qq_4026056521 小时前
python爬虫(一) ---- 静态html数据抓取
爬虫·python·html
加油201921 小时前
爬虫框架: selenium API使用介绍
爬虫·selenium·测试工具
好开心啊没烦恼1 天前
Python数据分析:使用爬虫从网页、社交媒体平台、论坛等公开资源提取中文和英文人名。
开发语言·爬虫·python·数据挖掘·数据分析
qq_402605651 天前
python爬虫(三) ---- 分页抓取数据
开发语言·爬虫·python
shelter -唯1 天前
基于selenium库的爬虫实战:京东手机数据爬取
爬虫·python·selenium
深蓝电商API2 天前
Scrapy 中间件详解:自定义下载器与爬虫的 “拦截器”
爬虫·scrapy·中间件
浔川python社3 天前
网络爬虫技术规范与应用指南系列(xc—1)
数据库·爬虫