自定义模型继承 Hugging 的 PreTrainedModel

问题背景

使用 HuggingFace 的 Trainer 进行训练,自定义模型继承 PreTrainedModel,希望能够通过 from_pretrained 容易地实现:从上次保存的 checkpoint 处继续训练。

问题描述

复制代码
Traceback (most recent call last):
  File "D:\PycharmProjects\gaze\SPIGA\train\train.py", line 60, in <module>
    .from_pretrained('checkpoint-1175')
  File "D:\Anaconda3\envs\transformers\lib\site-packages\transformers\modeling_utils.py", line 2535, in from_pretrained
    config, model_kwargs = cls.config_class.from_pretrained(
AttributeError: 'NoneType' object has no attribute 'from_pretrained'

问题分析

问题定位为:cls.config_class 为 None,结果导致 'NoneType' object has no attribute 'from_pretrained'

问题解决

自定义模型时,声明 config_class

python 复制代码
from transformers.configuration_utils import PretrainedConfig
from transformers.modeling)utils import PreTrainedModel

class CustomModel(PreTrainedModel):
	# 注意 1:在这里声明 config_class
    config_class = PretrainedConfig
    # 注意 2:重写的 __init__ 方法需要有 config 参数,不然会报错
    def __init__(self, config=PretrainedConfig(), num_landmarks=98, num_edges=15, steps=3, **kwargs):
        super().__init__(config=config)
        # .......
相关推荐
AI_567810 小时前
Nmap端口扫描:SYN扫描+脚本绕过提升成功率
人工智能·nmap
人工智能培训10 小时前
多模态大模型的统一表征与推理范式
人工智能·深度学习·ai大模型·多模态学习·具身智能·企业ai转型
szxinmai主板定制专家10 小时前
RK3588 8个USB工控解决方案,适用于机器视觉,工业互联等
arm开发·人工智能·fpga开发
mao_feng10 小时前
《AI智脉速递》2026 年 2月16日 - 2月23日
人工智能
2501_9436953310 小时前
大专市场调查与统计分析专业,怎么学习市场调研问卷的设计?
人工智能·学习
阿甘编程点滴10 小时前
人声伴奏分离工具5款实测精选
人工智能
小咖自动剪辑10 小时前
豆包AI去水印插件:一键去除图片水印,网页/电脑/手机版通用教程
人工智能
qq_3903695310 小时前
2025年国内互联网发展总结
人工智能
2501_9269783310 小时前
概率分形理论对 LLM 大模型结构与类智能涌现的统一解释--及优化应用的方法--指数级规模的效率和体积提升。
人工智能·经验分享·agi
吾在学习路11 小时前
SAMCT: Segment Any CT Allowing Labor-Free Task-Indicator Prompts
深度学习·计算机视觉