Python 爬虫:多进程,多线程爬虫<提高爬取效率>

关于多进程,多线程的知识,请自行查询资料补充· ~~~~~~~~~~~

使用多进程:

在python中,使用多进程需要先导包:

python 复制代码
from threding import Thread


def work(name):

    for i in range(1000):
        print(f"我是线程:{name}, {i}")



if __name__ == "__main__":

    for i in range(10):
        # 创建 十个线程
        t = Thread(target=work, args=(f"线程{i}",))

        t.start()

但是以上不推荐使用,

我们可以模拟一个场景, 例如 你来银行办理业务: 银行提供了5个窗口, 相当于开了5个线程, 而客户就是任务, 如果客户有100个,那么每个人都依次排队去办理业务, 这样我们就要写一个很复杂的检测系统, 所以, 这里直接使用线程池, 使用线程池就可以避免这种情况的发生:

使用线程池可以自动的帮我们来完成检测,调度等操作,我们只需要将任务交给线程池即可。

相关推荐
深蓝电商API4 小时前
Scrapy ImagesPipeline和FilesPipeline自定义使用
爬虫·python·scrapy
深蓝电商API5 小时前
Scrapy与Splash结合爬取JavaScript渲染页面
javascript·爬虫·python·scrapy
小白学大数据6 小时前
随机间隔在 Python 爬虫中的应用实践
开发语言·c++·爬虫·python
Python大数据分析@6 小时前
我常用的一个爬虫利器,自动采集视频数据
爬虫
电商API&Tina8 小时前
合规电商数据采集 API|多平台实时数据抓取,告别爬虫封号风险
大数据·开发语言·前端·数据库·爬虫·python
tang7778919 小时前
爬虫如何绕过绕过“5秒盾”Cloudflare:从浏览器指纹模拟到Rust求解之不完全指南
开发语言·爬虫·rust·cloudflare
深蓝电商API19 小时前
Scrapy爬虫限速与并发控制最佳实践
爬虫·python·scrapy
Derrick__119 小时前
淘宝MD5爬虫
爬虫·python
小白学大数据1 天前
爬虫技术选股:Python 自动化筛选潜力股
开发语言·爬虫·python·自动化
深蓝电商API1 天前
Scrapy日志系统详解与生产环境配置
爬虫·python·scrapy