Python并发编程:多线程与多进程的实战指南

Python并发编程:多线程与多进程的实战指南

在Python中处理大量任务时,并发编程能够显著提升程序性能。本文将详细介绍多线程与多进程的实现方法及适用场景。

什么是并发?

并发是指程序同时处理多个任务的能力。在Python中,有两种主要的并发方式:

多线程

多线程是在同一个进程内创建多个执行线程,共享进程的内存空间。适用于I/O密集型任务。

python 复制代码
import threading
import time

def print_numbers():
    for i in range(5):
        time.sleep(1)
        print(f'Thread {threading.current_thread().name}: {i}')

t1 = threading.Thread(target=print_numbers, name='Thread-1')
t2 = threading.Thread(target=print_numbers, name='Thread-2')
t1.start()
t2.start()
t1.join()
t2.join()

多进程

多进程是通过创建多个独立的进程来并行执行任务,每个进程有独立的内存空间。适用于CPU密集型任务。

python 复制代码
from multiprocessing import Process
import time

def calculate():
    print('Starting calculation...')
    time.sleep(3)
    print('Calculation complete')

p1 = Process(target=calculate)
p2 = Process(target=calculate)
p1.start()
p2.start()
p1.join()
p2.join()

多线程 vs 多进程

特性 多线程 多进程
内存共享
启动开销
上下文切换
适用场景 I/O密集型 CPU密集型

实战案例:爬虫并发

python 复制代码
import requests
from concurrent.futures import ThreadPoolExecutor

def fetch_url(url):
    response = requests.get(url)
    return response.text

urls = ['https://example.com', 'https://juejin.cn', 'https://zhihu.com']

with ThreadPoolExecutor(max_workers=5) as executor:
    results = list(executor.map(fetch_url, urls))
    print(results)

最佳实践

  1. 避免全局解释器锁(GIL):多线程在Python中受GIL限制,不适合CPU密集型任务
  2. 使用合适的数据结构:线程间共享数据时注意同步
  3. 合理设置线程池大小:根据CPU核心数调整
  4. 监控资源使用:避免过度消耗系统资源

总结

  • 多线程适合I/O密集型任务
  • 多进程适合CPU密集型任务
  • 根据实际需求选择合适的并发方式
  • 注意资源管理和性能优化
相关推荐
fliter2 小时前
用 Builder Pattern 改造 Ping:让 Rust FFI 代码更干净
后端
geovindu3 小时前
go: Generators Pattern
开发语言·后端·设计模式·golang·生成器模式
程序猿阿越3 小时前
AutoMQ源码(一)读、写、Compaction
java·后端·源码
foggyprojects3 小时前
一个企业查询问题,如何从自然语言走到 DSL 再走到 SQL
后端
掘金者阿豪3 小时前
PDO连金仓数据库(下篇):预处理语句、大对象和批量操作
后端
RealPluto4 小时前
Rancher证书轮换过期导致不能访问UI问题处理
后端
Asize4 小时前
Bun + TypeScript 实战:从接口约束到 RESTful 路由设计
后端·typescript·代码规范
鱼人4 小时前
Go 操作 MySQL:常用写法与最佳实践
后端
挖坑的张师傅4 小时前
方便 Mac 本机运行 e2b 的沙箱方案 e2b-local
人工智能·后端