【不背八股】1.if __name__ == "__main__" 有什么作用?

起名动机

最近开始准备秋招,技术圈惯例会把常见的面试问答题戏称为"八股文",网上流传不少这样的材料,写得晦涩难懂,以至于让好多求职者去背诵

在我看来,用文科思维学工科毫无意义,八股实际就是一些基础计算机科学知识,如何用清晰地方式去理解,实践,应用才更有价值。

因此,打算开个新的系列文章[不背八股],用一种全新的表述方式,重新理解八股面试题。

从一个报错开始

在项目实践中,遇到报错:

vbnet 复制代码
RuntimeError:
        An attempt has been made to start a new process before the
        current process has finished its bootstrapping phase.

        This probably means that you are not using fork to start your
        child processes and you have forgotten to use the proper idiom
        in the main module:

            if __name__ == '__main__':
                freeze_support()
                ...

        The "freeze_support()" line can be omitted if the program
        is not going to be frozen to produce an executable.

        To fix this issue, refer to the "Safe importing of main module"
        section in https://docs.python.org/3/library/multiprocessing.htm

DeepSeek**给出的解释是:

若主模块未保护入口点(即缺少 if name == 'main':),会导致子进程重复执行主模块代码。

将主代码移至if __name__ == '__main__':下之后,果然问题解决了。

这不由让我进一步思考:多数情况下,把这个操作作为一种惯例,没有思考过为什么要这么做,这么做为什么有效。

正好看到一道面试题:if __name__ == "__main__"有什么作用?借此把这个问题再探究一下。

__name__是什么?

首先要理解__name__的作用。

__name__ 是 Python 在加载模块(文件)时,解释器自动设置的一个全局变量,用来标识这个模块的"名称"。

举个简单的例子,创建一个hello.py

bash 复制代码
print("我是:", __name__)

运行输出结果:

markdown 复制代码
我是: __main__

再建立一个新的文件test.py,去导入这个文件

arduino 复制代码
import hello

运行输出结果:

复制代码
我是: hello

因此可以得到结论:

  • __name__在直接运行时值为"main"
  • __name__被导入时值为模块名

当运行一个 Python 文件,或者通过 import 导入一个模块,解释器隐式去做这件事:

ini 复制代码
# 如果是直接运行
import types

module = types.ModuleType("__main__")  # 创建模块对象
module.__name__ = "__main__"
exec(open("foo.py").read(), module.__dict__)  # 执行代码

# 如果是模块导入
import importlib

spec = importlib.util.find_spec("模块名称")
module = importlib.util.module_from_spec(spec)
spec.loader.exec_module(module)

因此,在一些模块中,往往会看到用if __name__ == "__main__"包裹的代码块,用来执行单元测试(cell test)。

多进程启动问题

下面回到开篇遇到的问题,为什么会出现这个error。

可以用以下代码,最小程度复现出该问题:

scss 复制代码
from multiprocessing import Process


def worker():
    print("子进程")


p = Process(target=worker)
p.start()

实际上,该问题只会在WindowsmacOS平台上发生。

对于Python 多进程(multiprocessing),Windows 和 macOS 默认采用spawn的方式进行启动。

它会新开一个空白的 Python 解释器进程,去重新导入主模块,因为主模块没放置在if __name__ == "__main__"之中,它被导入时,又会被再次执行一下,这就导致无限递归执行,出现此问题。

Linux 采用 fork 的方式,操作系统会直接复制当前进程的内存和运行状态,不会重新执行主模块,因此不会出现该问题。

项目 Linux Windows/macOS
启动方式 fork spawn
主模块会不会重新执行 ❌ 否 ✅ 是
是否必须加 if __name__ == '__main__' 推荐 ✅ 必须
报错可能性 较低 较高(会崩)
相关推荐
listhi5204 分钟前
基于改进SET的时频分析MATLAB实现
开发语言·算法·matlab
老蒋新思维12 分钟前
创客匠人 2025 全球创始人 IP+AI 万人高峰论坛:AI 赋能下知识变现与 IP 变现的实践沉淀与行业启示
大数据·人工智能·网络协议·tcp/ip·重构·创始人ip·创客匠人
Keep_Trying_Go39 分钟前
基于Zero-Shot的目标计数算法详解(Open-world Text-specified Object Counting)
人工智能·pytorch·python·算法·多模态·目标统计
AKAMAI1 小时前
Akamai 宣布收购功能即服务公司 Fermyon
人工智能·云计算
xl.liu1 小时前
零售行业仓库商品数据标记
算法·零售
河南博为智能科技有限公司1 小时前
高集成度国产八串口联网服务器:工业级多设备联网解决方案
大数据·运维·服务器·数据库·人工智能·物联网
confiself1 小时前
通义灵码分析ms-swift框架中CHORD算法实现
开发语言·算法·swift
做怪小疯子1 小时前
LeetCode 热题 100——二叉树——二叉树的层序遍历&将有序数组转换为二叉搜索树
算法·leetcode·职场和发展
CoderYanger1 小时前
递归、搜索与回溯-记忆化搜索:38.最长递增子序列
java·算法·leetcode·1024程序员节
光路科技1 小时前
人工智能时代,工业以太网正在“进化”成什么样?
人工智能