timm从本地加载预训练模型

想要从timm加载本地预训练模型,首先是参考timm.create_model()从本地加载pretrained模型

复制代码
model = timm.create_model('modelxxx', pretrained=True,  xxx)

改为

复制代码
pretrained_cfg = timm.models.create_model("modelxxx").default_cfg
pretrained_cfg['file'] = 'path/to/checkpoint'
model = timm.models.create_model("modelxxx", pretrained=True, xxx, pretrained_cfg=pretrained_cfg))  

但是遇到错误

复制代码
AssertionError: pretrained_cfg should not be set when sourcing model from Hugging Face Hub.

后来参考LocalEntryNotFoundError when loading downloaded pretrained model using timm.create_model (side load offline weights, e.g. on Kaggle) #1826
成功将从本地加载预训练模型

复制代码
timm.create_model(
  'modelxxx',
  pretrained=True,
  pretrained_cfg_overlay=dict(file='path/to/checkpoint'),
)
相关推荐
大蚂蚁2号3 分钟前
Python 项目架构深度解析:从混乱到清晰
开发语言·python·架构
老徐聊GEO1 小时前
AI搜索流量转化率实测分享:我的案例与复盘
人工智能·python
草莓熊Lotso1 小时前
【LangChain】流式传输原理与 LangSmith 应用监控全解析
人工智能·python·langchain·gpt-3
老毛肚8 小时前
jeecg-boot-base-core 02 day
javascript·python
yaoxin5211238 小时前
434. Java 日期时间 API - Period 基于日期的时间段
java·开发语言·python
岁月宁静9 小时前
RAG 文档摄入全链路,从原理到生产落地
vue.js·人工智能·python
JaydenAI10 小时前
[对比学习LangChain和MAF-07]如何引入人机交互的审批流程
python·ai·langchain·c#·agent·hitl·maf
神奇元创10 小时前
商用级光路加速卡:大模型推理的极速落地方案
python·神经网络·fpga开发·dsp开发
运筹vivo@11 小时前
Python ContextVar 底层机制与内存模型拆解
前端·数据库·python