【不背八股】1.if __name__ == "__main__" 有什么作用?

起名动机

最近开始准备秋招,技术圈惯例会把常见的面试问答题戏称为"八股文",网上流传不少这样的材料,写得晦涩难懂,以至于让好多求职者去背诵

在我看来,用文科思维学工科毫无意义,八股实际就是一些基础计算机科学知识,如何用清晰地方式去理解,实践,应用才更有价值。

因此,打算开个新的系列文章[不背八股],用一种全新的表述方式,重新理解八股面试题。

从一个报错开始

在项目实践中,遇到报错:

vbnet 复制代码
RuntimeError:
        An attempt has been made to start a new process before the
        current process has finished its bootstrapping phase.

        This probably means that you are not using fork to start your
        child processes and you have forgotten to use the proper idiom
        in the main module:

            if __name__ == '__main__':
                freeze_support()
                ...

        The "freeze_support()" line can be omitted if the program
        is not going to be frozen to produce an executable.

        To fix this issue, refer to the "Safe importing of main module"
        section in https://docs.python.org/3/library/multiprocessing.htm

DeepSeek**给出的解释是:

若主模块未保护入口点(即缺少 if name == 'main':),会导致子进程重复执行主模块代码。

将主代码移至if __name__ == '__main__':下之后,果然问题解决了。

这不由让我进一步思考:多数情况下,把这个操作作为一种惯例,没有思考过为什么要这么做,这么做为什么有效。

正好看到一道面试题:if __name__ == "__main__"有什么作用?借此把这个问题再探究一下。

__name__是什么?

首先要理解__name__的作用。

__name__ 是 Python 在加载模块(文件)时,解释器自动设置的一个全局变量,用来标识这个模块的"名称"。

举个简单的例子,创建一个hello.py

bash 复制代码
print("我是:", __name__)

运行输出结果:

markdown 复制代码
我是: __main__

再建立一个新的文件test.py,去导入这个文件

arduino 复制代码
import hello

运行输出结果:

复制代码
我是: hello

因此可以得到结论:

  • __name__在直接运行时值为"main"
  • __name__被导入时值为模块名

当运行一个 Python 文件,或者通过 import 导入一个模块,解释器隐式去做这件事:

ini 复制代码
# 如果是直接运行
import types

module = types.ModuleType("__main__")  # 创建模块对象
module.__name__ = "__main__"
exec(open("foo.py").read(), module.__dict__)  # 执行代码

# 如果是模块导入
import importlib

spec = importlib.util.find_spec("模块名称")
module = importlib.util.module_from_spec(spec)
spec.loader.exec_module(module)

因此,在一些模块中,往往会看到用if __name__ == "__main__"包裹的代码块,用来执行单元测试(cell test)。

多进程启动问题

下面回到开篇遇到的问题,为什么会出现这个error。

可以用以下代码,最小程度复现出该问题:

scss 复制代码
from multiprocessing import Process


def worker():
    print("子进程")


p = Process(target=worker)
p.start()

实际上,该问题只会在WindowsmacOS平台上发生。

对于Python 多进程(multiprocessing),Windows 和 macOS 默认采用spawn的方式进行启动。

它会新开一个空白的 Python 解释器进程,去重新导入主模块,因为主模块没放置在if __name__ == "__main__"之中,它被导入时,又会被再次执行一下,这就导致无限递归执行,出现此问题。

Linux 采用 fork 的方式,操作系统会直接复制当前进程的内存和运行状态,不会重新执行主模块,因此不会出现该问题。

项目 Linux Windows/macOS
启动方式 fork spawn
主模块会不会重新执行 ❌ 否 ✅ 是
是否必须加 if __name__ == '__main__' 推荐 ✅ 必须
报错可能性 较低 较高(会崩)
相关推荐
ai产品老杨1 小时前
打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程的智慧工业开源了
人工智能·开源·音视频·能源
小陈phd2 小时前
高级RAG策略学习(五)——llama_index实现上下文窗口增强检索RAG
人工智能
凯禾瑞华养老实训室3 小时前
人才教育导向下:老年生活照护实训室助力提升学生老年照护服务能力
人工智能
luckys.one3 小时前
第9篇:Freqtrade量化交易之config.json 基础入门与初始化
javascript·数据库·python·mysql·算法·json·区块链
湫兮之风4 小时前
Opencv: cv::LUT()深入解析图像块快速查表变换
人工智能·opencv·计算机视觉
~|Bernard|5 小时前
在 PyCharm 里怎么“点鼠标”完成指令同样的运行操作
算法·conda
战术摸鱼大师5 小时前
电机控制(四)-级联PID控制器与参数整定(MATLAB&Simulink)
算法·matlab·运动控制·电机控制
Christo35 小时前
TFS-2018《On the convergence of the sparse possibilistic c-means algorithm》
人工智能·算法·机器学习·数据挖掘
qq_508823405 小时前
金融量化指标--2Alpha 阿尔法
大数据·人工智能
黑金IT5 小时前
`.cursorrules` 与 `.cursorcontext`:Cursor AI 编程助手时代下的“双轨配置”指南
人工智能