Python并发编程(1)——Python并发编程的几种实现方式

更多精彩内容,请关注同名公众:一点sir(alittle-sir)

Python 并发编程是指在 Python 中编写能够同时执行多个任务的程序。并发编程在任何一门语言当中都是比较难的,因为会涉及各种各样的问题,在Python当中也不例外。Python 提供了多种方式来实现并发,包括多线程(threading)、多进程(multiprocessing)、异步编程(asyncio),以及一些高级用法concurrent.futures和第三方库如gevent。

多线程 (Threading)

多线程是通过使用 threading 模块来创建和管理线程。线程是轻量级的过程,可以与同一进程中的其他线程共享数据和资源。然而,由于 Python 的全局解释器锁(GIL)的存在,如果用的解释器是CPython的话,那么多线程在 CPU 密集型任务上不会有性能提升的,但是IO密集型的是会有的。

python 复制代码
import threading
import time

def worker(num):
    print(f"Worker {num} starting")
    time.sleep(2)
    print(f"Worker {num} finished")

threads = []
for i in range(5):
    t = threading.Thread(target=worker, args=(i,))
    threads.append(t)
    t.start()

# Wait for all threads to complete
for t in threads:
    t.join()
print("All workers finished.")

上面的例子中,通过threading模块中的Thread启动了另一个线程,输出中首先出现的是每个线程的启动消息,如 "Worker 0 starting",然后是 "Worker 1 starting" 等等。

接下来是每个线程的完成消息,如 "Worker 0 finished"。由于线程的执行顺序不是固定的,因此实际输出中的线程完成顺序可能会有所不同。

全局解释器锁(GIL)是历史历史遗留下来的问题,在Python3.13可能会得到解决。

多进程 (Multiprocessing)

多进程则可以通过使用 multiprocessing 模块来创建独立的进程。每个进程都有自己的内存空间,因此可以绕过 GIL,适用于 CPU 密集型任务。

python 复制代码
from multiprocessing import Process
import time

def worker(num):
    print(f"Worker {num} starting")
    time.sleep(2)
    print(f"Worker {num} finished")

processes = []
for i in range(5):
    p = Process(target=worker, args=(i,))
    processes.append(p)
    p.start()

# Wait for all processes to complete
for p in processes:
    p.join()
print("All workers finished.")

多进程与多线程示例类似,但这里是在不同的进程中执行。通过multiprocessing模块中的Process启动了另一个进程,每个进程开始和完成的消息按顺序出现。由于进程之间没有共享内存,每个进程都在独立的环境中运行,因此输出中的完成顺序与启动顺序相同。

异步编程 (Asyncio)

Python 3.4 引入了 asyncio 模块,它是一个用于编写单线程并发代码的模块,使用 async 和 await 关键字。异步编程允许你编写并发代码,以非阻塞的方式运行。这非常适合 I/O 密集型任务,如网络请求、文件操作等。

python 复制代码
import asyncio

async def worker(num):
    print(f"Worker {num} starting")
    await asyncio.sleep(2)
    print(f"Worker {num} finished")

async def main():
    tasks = [worker(i) for i in range(5)]
    await asyncio.gather(*tasks)

asyncio.run(main())
print("All workers finished.")

由于协程是基于事件循环的,因此输出中的完成顺序可能与启动顺序不同。异步编程也是python并发编程中比较重要的一个概念,后面很大篇幅都要围绕这个异步编程来展开的。

使用 concurrent.futures

concurrent.futures 提供了一个高层次的接口来处理并行执行的任务,实际上就是线程池或者进程池的玩意,这个池的概念就是线程或者进程用完不销毁,重复利用,具体后面展开说说。

示例:
python 复制代码
from concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor
import time

def worker(num):
    print(f"Worker {num} starting")
    time.sleep(2)
    return f"Worker {num} finished"

with ThreadPoolExecutor(max_workers=5) as executor:
    futures = [executor.submit(worker, i) for i in range(5)]

for future in futures:
    print(future.result())

print("All workers finished.")

首先,创建了一个最大容纳 5 个工作线程的线程池。然后,提交了 5 个 worker 任务到线程池中,并立即返回了 5 个 Future 对象。接着,程序遍历这些 Future 对象,等待每个任务完成,并打印它们的返回值。最后,打印所有工作线程已经完成的消息。不过还是那个问题,由于 Python 的全局解释器锁(GIL),在 CPU 密集型任务中,线程池并不会带来性能上的提升。

以上这些方法都可以根据你的具体需求来选择使用。如果你需要进行更多的细节控制或者有特定的性能要求,你还可以考虑使用更底层的 API 或者第三方库。

更多精彩内容,请关注同名公众:一点sir(alittle-sir)

相关推荐
冷雨夜中漫步5 小时前
Python快速入门(6)——for/if/while语句
开发语言·经验分享·笔记·python
郝学胜-神的一滴6 小时前
深入解析Python字典的继承关系:从abc模块看设计之美
网络·数据结构·python·程序人生
百锦再6 小时前
Reactive编程入门:Project Reactor 深度指南
前端·javascript·python·react.js·django·前端框架·reactjs
喵手7 小时前
Python爬虫实战:旅游数据采集实战 - 携程&去哪儿酒店机票价格监控完整方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集结果csv导出·旅游数据采集·携程/去哪儿酒店机票价格监控
2501_944934737 小时前
高职大数据技术专业,CDA和Python认证优先考哪个?
大数据·开发语言·python
helloworldandy8 小时前
使用Pandas进行数据分析:从数据清洗到可视化
jvm·数据库·python
肖永威9 小时前
macOS环境安装/卸载python实践笔记
笔记·python·macos
TechWJ9 小时前
PyPTO编程范式深度解读:让NPU开发像写Python一样简单
开发语言·python·cann·pypto
枷锁—sha9 小时前
【SRC】SQL注入WAF 绕过应对策略(二)
网络·数据库·python·sql·安全·网络安全
abluckyboy10 小时前
Java 实现求 n 的 n^n 次方的最后一位数字
java·python·算法