54、【Ubuntu】【Gitlab】拉出内网 Web 服务:http.server 单/多线程分析(六)

【声明】本博客所有内容均为个人业余时间创作,所述技术案例均来自公开开源项目(如Github,Apache基金会),不涉及任何企业机密或未公开技术,如有侵权请联系删除

背景

上篇 blog
【Ubuntu】【Gitlab】拉出内网 Web 服务:http.server 单/多线程分析(五)

分析了 Python GIL 锁在多线程环境下,对 IO 操作(比如 Web 服务并发),仍然有效果的原因,下面继续

Python http.server 单/多线程分析

OK,前面分析了 Python 的 GIL 锁限制了对于一个 Python 进程,即使在多线程环境下,也不能并行的能力,这里需要注意下,并行和并发的区别

  • 并发表示多个任务交替推进,宏观上看这些多个任务就是在同时进行(即使 CPU 交替执行,其时间依然很短,给人感觉就是在同时进行一样),不需要 CPU 多核,靠线程切换就能完成 ,所以即使 Python 进程被 GIL 限制,其多线程能力依然对提升 Web 性能依然有效的原因
  • 并行表示多个任务真正同时进行(物理上同时运行),需要多核,不能靠多线程切换完成,适合 CPU 密集型任务的处理 ,此时 Python 的 GIL 锁就起作用了,GIL 锁限制了在同一时刻,只能有一个线程在真正执行,也就是说,一个 Python 程序只能用一个 CPU 核来执行任务

    线程 1 和线程 2,此时可以真正物理上同时使用 CPU 核心来执行任务,而不需要等待

可以看到,并发和并行不是一回事,就好比一个人边煮饭边听音乐(通过切换注意力实现任务的并发),而并行是两个人,一个人煮饭,一个人听音乐,这个就是真正的同时进行,所以要注意,高并发 ≠ 高并行

OK,下面再分析下 GIL 锁限制 Python 字节码并行执行的原因

首先,CPython 使用引用计数(Reference Counting) 管理内存 ,在 CPython 中,每个 Python 对象(比如 intliststr)都有一个 ob_refcnt 字段,记录有多少变量,或容器引用它(注意,引用计数属于 CPython 内部实现机制,需查看解释器源码才能看到

举个例子:

  • 当给 a = [1, 2, 3] 赋值时,列表对象的 ob_refcnt 为 1
  • 然后令 b = a,此时 ob_refcnt 会变成 2
  • ab 被删除或重新赋值时,ob_refcnt 会减 1
  • ob_refcnt == 0 时,CPython 会立即释放内存,而不是等垃圾回收

这种机制简单高效,但有一个致命问题,ob_refcnt 的加减不是原子操作!

如果没有 GIL 锁,假设两个线程同时操作同一对象,该对象初始值是 2,俩线程都要对其进行减 1 操作

可以看到,ob_refcnt 被两个线程减引用操作,实际应该变成 0,因为两次减 1,但结果却是 1,此时该对象永远不会被释放,就会造成内存泄漏,更严重的是,如果引用计数错误地编程负数或乱掉,还可能直接导致解释器崩溃(segfault),所以 CPython 必须保证任何修改 Python 对象引用计数的操作,必须是线程安全的

为了解决这个问题,CPython 在其发展的初期(上世纪 90 年代)选择了加一把全局大锁(GIL),所有涉及 Python 对象的操作(包括引用计数增减)都必须持有 GIL,同一时刻只有一个线程能持有 GIL,也就不可能出现并行修改,并且其实现简单,对单线程性能基本无影响

从本质上,GIL 是个懒人方案(也是最简单的方案),用一把锁保护整个解释器,避免给每个对象加锁(那样开销太大)


OK,本篇先到这里,如有疑问,欢迎评论区留言讨论,祝各位功力大涨,技术更上一层楼!!!更多内容见下篇 blog
【Ubuntu】【Gitlab】拉出内网 Web 服务:http.server 单/多线程分析(七)

相关推荐
Mars.CN3 小时前
obs-websocket 5.x.x Protocol 全中文翻译
网络·websocket·网络协议
基哥的奋斗历程3 小时前
从零部署HTTPS网站完整指南-第一章
网络协议·http·https
阿杰同学3 小时前
Java 网络协议面试题答案整理,最新面试题
java·开发语言·网络协议
lcyw3 小时前
A MSE+Fmp4+websocket+H265播放器
网络·websocket·网络协议
koping_wu3 小时前
【计算机网络】OSI七层模型、TCP协议、HTTP协议
tcp/ip·计算机网络·http
卓码软件测评3 小时前
Gatling WebSocket测试支持:ws、wsConnect、sendText、checkTextMessage详解
网络·websocket·网络协议·测试工具·ci/cd·自动化
HIT_Weston4 小时前
55、【Ubuntu】【Gitlab】拉出内网 Web 服务:http.server 单/多线程分析(七)
前端·http·gitlab
feathered-feathered4 小时前
网络套接字——Socket网络编程(TCP编程详解)
java·网络·后端·网络协议·tcp/ip
乾元18 小时前
SDN 与 AI 协同:控制面策略自动化与策略一致性校验
运维·网络·人工智能·网络协议·华为·系统架构·ansible