Python 爬虫:多进程,多线程爬虫<提高爬取效率>

关于多进程,多线程的知识,请自行查询资料补充· ~~~~~~~~~~~

使用多进程:

在python中,使用多进程需要先导包:

python 复制代码
from threding import Thread


def work(name):

    for i in range(1000):
        print(f"我是线程:{name}, {i}")



if __name__ == "__main__":

    for i in range(10):
        # 创建 十个线程
        t = Thread(target=work, args=(f"线程{i}",))

        t.start()

但是以上不推荐使用,

我们可以模拟一个场景, 例如 你来银行办理业务: 银行提供了5个窗口, 相当于开了5个线程, 而客户就是任务, 如果客户有100个,那么每个人都依次排队去办理业务, 这样我们就要写一个很复杂的检测系统, 所以, 这里直接使用线程池, 使用线程池就可以避免这种情况的发生:

使用线程池可以自动的帮我们来完成检测,调度等操作,我们只需要将任务交给线程池即可。

相关推荐
qq_312920111 小时前
Nginx限流与防爬虫与安全配置方案
运维·爬虫·nginx·安全
华科云商xiao徐2 小时前
Java并发编程常见“坑”与填坑指南
javascript·数据库·爬虫
夜无霄2 小时前
安卓逆向(一)Ubuntu环境配置
linux·运维·爬虫·ubuntu
zhousenshan13 小时前
Python爬虫常用框架
开发语言·爬虫·python
deepwater_zone15 小时前
网络爬虫(web crawler)
爬虫
华科云商xiao徐1 天前
告别IP被封!分布式爬虫的“隐身”与“分身”术
爬虫·数据挖掘·数据分析
q567315231 天前
告别低效:构建健壮R爬虫的工程思维
开发语言·爬虫·r语言
一个天蝎座 白勺 程序猿2 天前
Python爬虫(47)Python异步爬虫与K8S弹性伸缩:构建百万级并发数据采集引擎
爬虫·python·kubernetes
华科云商xiao徐2 天前
告别低效:构建健壮R爬虫的工程思维
爬虫
熊猫钓鱼>_>3 天前
2025反爬虫之战札记:从robots.txt到多层防御的攻防进化史
开发语言·c++·爬虫