python多进程库(multiprocessing)

multiprocessing本身是Python的多进程库,用来处理与多进程相关的操作。但是由于进程与进程之间不能直接共享内存和堆栈资源,而且启动新的进程开销也比线程大得多,因此使用多线程来爬取比使用多进程有更多的优势。multiprocessing下面有一个dummy模块,它可以让Python的线程使用multiprocessing****的各种方法。

**dummy下面有一个Pool类,它用来实现线程池。这个线程池有一个map()**方法,可以让线程池里面的所有线程都"同时"执行一个函数。

例如计算09的每个数的平方。

学习了for****循环之后,代码可能会写成这样:

foriin range(10):

print(i**i)

这种写法当然可以得到结果,但是代码是一个数一个数地计算,效率并不高。而如果使用多线程的技术,让代码同时计算很多个数的平方,就需要使用multiprocessing.dummy****来实现:

python 复制代码
 from multiprocessing.dummy import Pool
  def calc_power2(num):
     return num * num
 pool = Pool(3)
 origin_num = [x for x in range(10)]
 result = pool.map(calc_power2, origin_num)
 print(f'计算0-9的平方分别为:{result}')

上面的代码中,先定义了一个函数用来计算平方,然后初始化了一个有3个线程的线程池。这3个线程负责计算10****个数字的平方,谁先计算完手上的这个数,谁就先取下一个数继续计算,直到把所有的数字都计算完成为止。
总结一下这个多线程用法

python 复制代码
from multiprocessing.dummy import Pool
def hanshu(canshu):
    return canshu+2

xiancheng = Pool(3)
canshujihe = [1,2,3,4,5]

shuchujieguo = xiancheng.map(hanshu,canshujihe)

print(shuchujieguo)
复制代码
from multiprocessing.dummy import Pool
这一行表示导入库模块

def hanshu(canshu):
    return canshu+2
上面两行是一个函数,函数有参数,有返回值
xiancheng = Pool(3)
设置几个线程,这里设置了3个线程
canshujihe = [1,2,3,4,5]
这里弄了一个参数的集合
shuchujieguo = xiancheng.map(hanshu,canshujihe)
输出的结果=线程设置.map(函数名不含括号,参数集合)
print(shuchujieguo)

打印结果

相关推荐
是娇娇公主~2 小时前
C++ 中 std::deque 的原理?它内部是如何实现的?
开发语言·c++·stl
2401_874732532 小时前
为你的Python脚本添加图形界面(GUI)
jvm·数据库·python
SuperEugene3 小时前
Axios 接口请求规范实战:请求参数 / 响应处理 / 异常兜底,避坑中后台 API 调用混乱|API 与异步请求规范篇
开发语言·前端·javascript·vue.js·前端框架·axios
FreakStudio3 小时前
0 元学嵌入式 GUI!保姆级 LVGL+MicroPython 教程开更,从理论到实战全搞定
python·单片机·嵌入式·面向对象·电子diy
xuxie994 小时前
N11 ARM-irq
java·开发语言
wefly20174 小时前
从使用到原理,深度解析m3u8live.cn—— 基于 HLS.js 的 M3U8 在线播放器实现
java·开发语言·前端·javascript·ecmascript·php·m3u8
luanma1509805 小时前
PHP vs C++:编程语言终极对决
开发语言·c++·php
寂静or沉默5 小时前
2026最新Java岗位从P5-P7的成长面试进阶资源分享!
java·开发语言·面试
剑穗挂着新流苏3125 小时前
117_PyTorch 实战:利用训练好的模型进行单张图片验证
人工智能·python·深度学习
Lethehong5 小时前
Python Selenium全栈指南:从自动化入门到企业级实战
python·selenium·测试工具·自动化