元类与 __init_subclass__：类是如何被“创建“出来的

文章目录

- [问题：`class` 关键字背后发生了什么](#问题：class 关键字背后发生了什么)
- 类的创建流水线
- [`type(name, bases, namespace)` 的三个参数](#type(name, bases, namespace) 的三个参数)
- `init_subclass`：元类的轻量替代
- - [`init_subclass` 的 `**kwargs` 传递](#__init_subclass__ 的 **kwargs 传递)
- [元类：当 `init_subclass` 不够用时](#元类：当 __init_subclass__ 不够用时)
- 元类的继承规则
- [元类 vs `init_subclass` 选型](#元类 vs __init_subclass__ 选型)
- [工程实战一：声明式 ORM 框架](#工程实战一：声明式 ORM 框架)
- 工程实战二：抽象方法强制实现
- [`init_subclass` 与元类的组合](#__init_subclass__ 与元类的组合)
- 元类常见陷阱
- - 陷阱一：多重元类冲突
  - [陷阱二：`init_subclass` 中的 `super()` 遗漏](#陷阱二：__init_subclass__ 中的 super() 遗漏)
  - [陷阱三：元类中的 `init` vs `new`](#陷阱三：元类中的 __init__ vs __new__)
- 小结

在 Python 中，类本身也是对象------而元类是创建这些对象的"工厂"。理解了元类，就理解了 Python 对象模型的最后一环。

问题：`class` 关键字背后发生了什么

先看一个看似简单的问题：class 语句执行时，Python 解释器到底做了什么？

python 复制代码

class Point:
    x: int = 0
    y: int = 0

    def distance(self) -> float:
        return (self.x ** 2 + self.y ** 2) ** 0.5

这个 class 块在概念上等价于以下步骤：

python 复制代码

# 1. 收集类体中的定义
class_body = {
    "x": 0,
    "y": 0,
    "distance": function_defined_in_scope,
    "__annotations__": {"x": int, "y": int},
}

# 2. 调用元类创建类对象
Point = type("Point", (object,), class_body)

type 是 Python 内置的默认元类 。每个类都是 type 的一个实例------正如每个整数都是 int 的一个实例。

python 复制代码

class Point:
    pass

print(type(Point))     # <class 'type'>
print(isinstance(Point, type))  # True

# 类比：
print(type(42))        # <class 'int'>
print(isinstance(42, int))     # True

# 42 是 int 的实例，Point 是 type 的实例

类的创建流水线

是
否
是
否
class 语句开始
收集类体命名空间

执行所有类体代码
定义了

init_subclass？
调用 init_subclass

钩子函数
定义了

metaclass？
调用 metaclass.new

创建类对象
调用 type.new

创建类对象
调用 metaclass.init

初始化类对象
调用 type.init

初始化类对象
类创建完成

绑定到类名

核心公式：

python 复制代码

# 每个 class 语句最终都等价于：
ClassName = metaclass.__new__(metaclass, name, bases, namespace)
metaclass.__init__(ClassName, name, bases, namespace)
# 如果有 __init_subclass__：
ClassName.__init_subclass__(**kwargs)

`type(name, bases, namespace)` 的三个参数

python 复制代码

# 动态创建类------与 class 语句等价
Point = type(
    "Point",                  # name：类名
    (object,),                # bases：父类元组
    {                         # namespace：类体命名空间
        "x": 0,
        "y": 0,
        "distance": lambda self: (self.x ** 2 + self.y ** 2) ** 0.5,
        "__annotations__": {"x": int, "y": int},
    },
)

p = Point()
p.x = 3
p.y = 4
print(p.distance())  # 5.0
print(type(p))       # <class '__main__.Point'>
print(type(Point))   # <class 'type'>

`__init_subclass__`：元类的轻量替代

大多数时候，不需要完整的元类------只需要在子类被定义时执行一些验证或注册。__init_subclass__ 正是为此设计的：

python 复制代码

class PluginBase:
    """插件基类------要求所有子类必须有 name 属性"""
    
    _registry: dict[str, type["PluginBase"]] = {}
    
    def __init_subclass__(cls, **kwargs):
        """子类定义时自动调用"""
        super().__init_subclass__(**kwargs)
        
        # 验证：必须有 name 属性
        if not hasattr(cls, "name"):
            raise TypeError(f"{cls.__name__} must define a 'name' class attribute")
        
        # 验证：必须实现 process 方法
        if "process" not in cls.__dict__:
            raise TypeError(f"{cls.__name__} must implement process() method")
        
        # 自注册到全局注册表
        cls._registry[cls.name] = cls
        print(f"Registered plugin: {cls.name} (from {cls.__module__})")


class ImagePlugin(PluginBase):
    name = "image"
    
    def process(self, data):
        return f"Processing image: {data}"


class VideoPlugin(PluginBase):
    name = "video"
    
    def process(self, data):
        return f"Processing video: {data}"

输出：

复制代码

Registered plugin: image (from __main__)
Registered plugin: video (from __main__)

`__init_subclass__` 的 `**kwargs` 传递

python 复制代码

class Validator:
    def __init_subclass__(cls, required: bool = False, **kwargs):
        super().__init_subclass__(**kwargs)
        cls._required = required
        print(f"  {cls.__name__}: required={required}")


class EmailValidator(Validator, required=True):
    """required=True 作为关键字参数传给 __init_subclass__"""
    pass


class NameValidator(Validator, required=False):
    pass

# 输出：
#   EmailValidator: required=True
#   NameValidator: required=False

注意 required=True 出现在类定义语句的父类列表 中------这是 Python 语法的一部分，专门为 __init_subclass__ 设计：

python 复制代码

class Child(Parent, keyword_arg=value):
    # keyword_arg 会传给 Parent.__init_subclass__
    pass

元类：当 `__init_subclass__` 不够用时

__init_subclass__ 在子类定义时 被调用，但它无法控制子类的实例化行为。如果需要在每次创建实例时执行逻辑，就需要元类。

元类的最小实现

python 复制代码

class LoggingMeta(type):
    """自动为所有子类添加日志功能"""
    
    def __new__(mcs, name, bases, namespace):
        """在类创建时被调用------可以修改 namespace"""
        # 为每个公共方法添加日志包装
        for key, value in namespace.items():
            if callable(value) and not key.startswith("_"):
                namespace[key] = mcs._wrap_with_logging(key, value)
        
        return super().__new__(mcs, name, bases, namespace)
    
    @staticmethod
    def _wrap_with_logging(method_name, method):
        def wrapper(self, *args, **kwargs):
            print(f"[{type(self).__name__}.{method_name}] Called with {args} {kwargs}")
            result = method(self, *args, **kwargs)
            print(f"[{type(self).__name__}.{method_name}] → {result!r}")
            return result
        return wrapper


class Service(metaclass=LoggingMeta):
    def create_user(self, name: str) -> dict:
        return {"id": 1, "name": name, "status": "created"}
    
    def delete_user(self, user_id: int) -> dict:
        return {"id": user_id, "status": "deleted"}


svc = Service()
svc.create_user("Alice")
# 输出：
# [Service.create_user] Called with ('Alice',) {}
# [Service.create_user] → {'id': 1, 'name': 'Alice', 'status': 'created'}

元类实战：单例模式

python 复制代码

class SingletonMeta(type):
    """元类实现单例------任何使用此元类的类都是单例"""
    _instances: dict[type, object] = {}
    
    def __call__(cls, *args, **kwargs):
        """拦截实例化：cls(...) 调用"""
        if cls not in cls._instances:
            cls._instances[cls] = super().__call__(*args, **kwargs)
        return cls._instances[cls]


class DatabaseConnection(metaclass=SingletonMeta):
    def __init__(self, host: str = "localhost", port: int = 3306):
        self.host = host
        self.port = port
        print(f"Connecting to {host}:{port}")


# 多次"创建"只返回同一个实例
conn1 = DatabaseConnection("db1.example.com", 3306)
# Connecting to db1.example.com:3306

conn2 = DatabaseConnection("db2.example.com", 5432)
# __init__ 不会被再次调用------直接返回已有实例

print(conn1 is conn2)            # True
print(conn2.host, conn2.port)    # db1.example.com 3306（原始值）

__call__ 是元类的关键 ：当 ClassName() 被调用时，Python 实际上调用的是元类的 __call__ 方法。这为拦截实例化提供了完美的切入点：

python 复制代码

# obj = MyClass(args)  背后的调用链：
# MyClass 的元类的 __call__(MyClass, args)
#   → MyClass 的元类的 __call__ 内部调用 super().__call__(args)
#     → type.__call__(MyClass, args)
#       → MyClass.__new__(MyClass, args)
#       → MyClass.__init__(obj, args)

元类实战：属性访问追踪

python 复制代码

class AttributeTracker(type):
    """追踪所有实例的属性赋值"""
    
    def __new__(mcs, name, bases, namespace):
        # 注入追踪逻辑到 __setattr__
        original_setattr = namespace.get("__setattr__")
        
        def tracked_setattr(self, key, value):
            print(f"  [TRACK] {type(self).__name__}.{key} = {value!r}")
            if original_setattr:
                original_setattr(self, key, value)
            else:
                super(type(self), self).__setattr__(key, value)
        
        namespace["__setattr__"] = tracked_setattr
        return super().__new__(mcs, name, bases, namespace)


class Tracked(metaclass=AttributeTracker):
    def __init__(self, name: str):
        self.name = name


obj = Tracked("Alice")
obj.age = 30
obj.email = "alice@example.com"

# 输出：
#   [TRACK] Tracked.name = 'Alice'
#   [TRACK] Tracked.age = 30
#   [TRACK] Tracked.email = 'alice@example.com'

元类的继承规则

python 复制代码

class MetaA(type):
    pass

class MetaB(MetaA):
    pass

# 规则一：子元类可以用于父元类的类
class A(metaclass=MetaA):
    pass

class B(A, metaclass=MetaB):
    pass  # OK------MetaB 是 MetaA 的子类

# 规则二：当多个基类有不同的元类时，必须有一个元类能兼容所有
class MetaX(type):
    pass

class X(metaclass=MetaX):
    pass

# ❌ TypeError: metaclass conflict
# class C(A, X):
#     pass
# A 的元类是 MetaA，X 的元类是 MetaX------两者不兼容

# ✅ 解决方案：创建一个继承两者的元类
class MetaAX(MetaA, MetaX):
    pass

class C(A, X, metaclass=MetaAX):
    pass  # OK

冲突的元类
❌ 冲突
❌ 冲突
MetaX (type)
class X(metaclass=MetaX)
MetaA (type)
class A(metaclass=MetaA)
class C(A, X)
合法的元类继承
父类
MetaA (type)
MetaB (MetaA)
class B(metaclass=MetaB)
class A(metaclass=MetaA)

元类 vs `__init_subclass__` 选型

场景	用 `__init_subclass__`	用元类
子类定义时验证	✅	✅（更重）
子类自注册	✅	✅
拦截类实例化 (`__call__`)	❌ 不触发	✅
修改类的方法/属性	❌ 类已创建完毕	✅ `__new__` 可以修改 namespace
控制 `__init__` 行为	❌ 不管实例化	✅
多个独立功能组合	✅ 简单叠加	⚠️ 需要多重继承元类
学习曲线	低	高
典型应用	Django ORM、插件系统	ORM 框架、Singleton、类型检查

原则：能用 __init_subclass__ 解决的，不要用元类。元类是 Python 中最强大的机制之一，也是最后的手段。

工程实战一：声明式 ORM 框架

模仿 SQLAlchemy 和 Django ORM 的设计，用 __init_subclass__ + 描述符构建一个声明式 ORM：

python 复制代码

"""声明式 ORM ------ 展示 __init_subclass__ + 描述符的组合威力"""
from typing import Any


class Field:
    """字段描述符------对应数据库列"""
    def __init__(self, column_type: type, primary_key: bool = False, nullable: bool = True):
        self.column_type = column_type
        self.primary_key = primary_key
        self.nullable = nullable
        self.name: str = ""  # 将在 __set_name__ 中设置
    
    def __set_name__(self, owner, name):
        self.name = name
    
    def __get__(self, instance, owner):
        if instance is None:
            return self
        return instance._data.get(self.name)
    
    def __set__(self, instance, value):
        if value is not None and not isinstance(value, self.column_type):
            raise TypeError(
                f"{self.name}: expected {self.column_type.__name__}, "
                f"got {type(value).__name__}"
            )
        instance._data[self.name] = value


class Integer(Field):
    def __init__(self, primary_key: bool = False, nullable: bool = True):
        super().__init__(column_type=int, primary_key=primary_key, nullable=nullable)


class String(Field):
    def __init__(self, max_length: int = 255, nullable: bool = True):
        super().__init__(column_type=str, nullable=nullable)
        self.max_length = max_length
    
    def __set__(self, instance, value):
        if value is not None and len(value) > self.max_length:
            raise ValueError(
                f"{self.name}: value too long ({len(value)} > {self.max_length})"
            )
        super().__set__(instance, value)


class Model:
    """基类------使用 __init_subclass__ 收集字段定义"""
    _fields: dict[str, Field]
    _table_name: str
    
    def __init_subclass__(cls, table: str | None = None, **kwargs):
        super().__init_subclass__(**kwargs)
        
        # 收集所有 Field 实例
        cls._fields = {}
        for name, value in cls.__dict__.items():
            if isinstance(value, Field):
                cls._fields[name] = value
        
        # 确定表名
        cls._table_name = table or cls.__name__.lower() + "s"
        
        # 确保有主键
        pk_count = sum(1 for f in cls._fields.values() if f.primary_key)
        if pk_count == 0:
            raise TypeError(f"{cls.__name__}: must define at least one primary key field")
        if pk_count > 1:
            raise TypeError(f"{cls.__name__}: only one primary key is allowed")
    
    def __init__(self, **kwargs):
        self._data: dict[str, Any] = {}
        for key, value in kwargs.items():
            setattr(self, key, value)
    
    def to_dict(self) -> dict[str, Any]:
        return {name: getattr(self, name) for name in self._fields}
    
    def __repr__(self):
        fields = ", ".join(
            f"{name}={getattr(self, name)!r}" for name in self._fields
        )
        return f"{type(self).__name__}({fields})"


# ===== 定义模型 =====
class User(Model, table="users"):
    id = Integer(primary_key=True)
    name = String(max_length=100)
    email = String(max_length=255)
    age = Integer(nullable=True)


# ===== 使用 =====
user = User(id=1, name="Alice", email="alice@example.com", age=30)
print(user)                         # User(id=1, name='Alice', email='alice@example.com', age=30)
print(user._table_name)             # users
print(user._fields)                 # {'id': <Integer>, 'name': <String>, ...}
print(user.to_dict())               # {'id': 1, 'name': 'Alice', ...}

# ❌ 类型检查生效
try:
    User(id="not-an-int", name="Bob", email="bob@test.com")
except TypeError as e:
    print(e)  # id: expected int, got str

# ❌ 长度检查生效
try:
    User(id=2, name="A" * 101, email="bob@test.com")
except ValueError as e:
    print(e)  # name: value too long (101 > 100)

# ❌ 缺少主键的模型定义会失败
try:
    class BadModel(Model):
        name = String()
        # 缺少 primary_key
except TypeError as e:
    print(e)  # BadModel: must define at least one primary key field

工程实战二：抽象方法强制实现

python 复制代码

class InterfaceMeta(type):
    """元类：强制子类实现标记为 abstract 的方法"""
    
    def __new__(mcs, name, bases, namespace):
        # 收集标记为 abstract 的方法
        abstract_methods = set()
        for key, value in namespace.items():
            if getattr(value, "_is_abstract", False):
                abstract_methods.add(key)
        
        cls = super().__new__(mcs, name, bases, namespace)
        cls._abstract_methods = abstract_methods
        
        return cls
    
    def __call__(cls, *args, **kwargs):
        """实例化时检查抽象方法是否被实现"""
        for method_name in cls._abstract_methods:
            method = getattr(cls, method_name, None)
            if method is not None and getattr(method, "_is_abstract", False):
                raise TypeError(
                    f"Can't instantiate {cls.__name__}: "
                    f"abstract method '{method_name}' not implemented"
                )
        return super().__call__(*args, **kwargs)


def abstractmethod(func):
    """装饰器：标记方法为抽象"""
    func._is_abstract = True
    return func


class DataExporter(metaclass=InterfaceMeta):
    """数据导出接口------使用元类强制子类实现"""
    
    @abstractmethod
    def export(self, data: list) -> bytes:
        """导出数据为字节"""
        ...
    
    @abstractmethod
    def get_extension(self) -> str:
        """返回文件扩展名"""
        ...


class CSVExporter(DataExporter):
    def export(self, data):
        return b"csv,data"
    
    def get_extension(self):
        return ".csv"


class JSONExporter(DataExporter):
    def export(self, data):
        return b'{"json": "data"}'
    # ❌ 缺少 get_extension


exporter = CSVExporter()  # ✅ OK------所有抽象方法都已实现

try:
    exporter = JSONExporter()
except TypeError as e:
    print(e)  # Can't instantiate JSONExporter: abstract method 'get_extension' not implemented

`__init_subclass__` 与元类的组合

两者可以共存------__init_subclass__ 作为元类的辅助钩子：

python 复制代码

class PluginMeta(type):
    """元类：管理插件生命周期"""
    
    def __call__(cls, *args, **kwargs):
        """实例化时触发 before_init / after_init 钩子"""
        instance = cls.__new__(cls, *args, **kwargs)
        
        if hasattr(cls, "before_init"):
            cls.before_init(instance, *args, **kwargs)
        
        cls.__init__(instance, *args, **kwargs)
        
        if hasattr(cls, "after_init"):
            cls.after_init(instance, *args, **kwargs)
        
        return instance


class Plugin(metaclass=PluginMeta):
    """插件基类------结合元类和 __init_subclass__"""
    _plugins: dict[str, type["Plugin"]] = {}
    
    def __init_subclass__(cls, category: str = "general", **kwargs):
        """子类定义时自动注册------由 __init_subclass__ 处理"""
        super().__init_subclass__(**kwargs)
        cls._category = category
        Plugin._plugins[cls.__name__] = cls
        print(f"  Plugin registered: {cls.__name__} (category={category})")
    
    @classmethod
    def list_by_category(cls, category: str) -> list[type["Plugin"]]:
        return [p for p in cls._plugins.values() if getattr(p, "_category", "") == category]


class ImageProcessor(Plugin, category="media"):
    def __init__(self, source: str):
        self.source = source
        print(f"  ImageProcessor initialized with {source}")
    
    def before_init(self, source):
        print(f"  [before_init] Validating image source: {source}")


class VideoProcessor(Plugin, category="media"):
    def __init__(self, source: str):
        self.source = source


proc = ImageProcessor("photo.jpg")
# 输出：
#   Plugin registered: ImageProcessor (category=media)
#   Plugin registered: VideoProcessor (category=media)
#   [before_init] Validating image source: photo.jpg
#   ImageProcessor initialized with photo.jpg

print(Plugin.list_by_category("media"))
# [<class 'ImageProcessor'>, <class 'VideoProcessor'>]

元类常见陷阱

陷阱一：多重元类冲突

python 复制代码

class MetaA(type):
    pass

class MetaB(type):
    pass

class BaseA(metaclass=MetaA):
    pass

class BaseB(metaclass=MetaB):
    pass

# ❌ TypeError: metaclass conflict
# class Broken(BaseA, BaseB):
#     pass

# ✅ 修复：创建组合元类
class CombinedMeta(MetaA, MetaB):
    pass

class Fixed(BaseA, BaseB, metaclass=CombinedMeta):
    pass  # OK

陷阱二：`__init_subclass__` 中的 `super()` 遗漏

python 复制代码

class Base:
    def __init_subclass__(cls, **kwargs):
        super().__init_subclass__(**kwargs)  # ← 必须调用！

class Middle(Base):
    def __init_subclass__(cls, **kwargs):
        super().__init_subclass__(**kwargs)

# 如果 Base 忘记调用 super()，Middle 的 __init_subclass__ 永远不会被触发
# 因为 __init_subclass__ 是通过父类的 super() 链传播的

陷阱三：元类中的 `init` vs `new`

python 复制代码

class WrongMeta(type):
    def __init__(cls, name, bases, namespace):
        """__init__ 中 cls 已经是完整的类对象"""
        # 此时可以修改类属性，但太晚了------类的 MRO 已经确定
        super().__init__(name, bases, namespace)
        cls._tracked = True

class CorrectMeta(type):
    def __new__(mcs, name, bases, namespace):
        """__new__ 中 namespace 还是字典------可以在类创建前修改"""
        if "save" in namespace:
            namespace["save"] = mcs._wrap_save(namespace["save"])
        return super().__new__(mcs, name, bases, namespace)

小结

概念	触发时机	修改能力	使用场景
`__init_subclass__`	子类定义时	子类属性（cls 已创建）	验证、注册、配置
元类 `__new__`	类创建前	namespace 字典	修改/注入方法、属性
元类 `__init__`	类创建后	类属性（cls 已创建）	添加类级配置
元类 `__call__`	类实例化时	实例创建流程	单例、实例池、拦截构造

元类和 __init_subclass__ 是 Python 对象模型的最后一块拼图。在 Python 数据模型：双下划线方法的全景图中曾遍历魔术方法，在属性查找顺序：实例 → 类 → 父类的完整 MRO 中曾剖析 MRO------而元类正是站在这些机制之上，让开发者能够在"类的类"这一层定义规则。

理解元类不是为了每次写代码都用它------恰恰相反，理解元类是为了在大多数时候确信 __init_subclass__ 已经足够。

如果这篇文章对理解 Python 元类有帮助，点赞收藏让更多人看到！关注专栏，持续获取 Python 进阶干货。

元类与 __init_subclass__：类是如何被“创建“出来的

文章目录

问题：class 关键字背后发生了什么

类的创建流水线

type(name, bases, namespace) 的三个参数

__init_subclass__：元类的轻量替代

__init_subclass__ 的 **kwargs 传递

元类：当 __init_subclass__ 不够用时

元类的最小实现

元类实战：单例模式

元类实战：属性访问追踪

元类的继承规则

元类 vs __init_subclass__ 选型

工程实战一：声明式 ORM 框架

工程实战二：抽象方法强制实现

__init_subclass__ 与元类的组合

元类常见陷阱

陷阱一：多重元类冲突

陷阱二：__init_subclass__ 中的 super() 遗漏

陷阱三：元类中的 __init__ vs __new__

小结

问题：`class` 关键字背后发生了什么

`type(name, bases, namespace)` 的三个参数

`__init_subclass__`：元类的轻量替代

`__init_subclass__` 的 `**kwargs` 传递

元类：当 `__init_subclass__` 不够用时

元类 vs `__init_subclass__` 选型

`__init_subclass__` 与元类的组合

陷阱二：`__init_subclass__` 中的 `super()` 遗漏

陷阱三：元类中的 `init` vs `new`