在复现SDXL-Turbo和stable-diffusion-2-1系列大模型过程中遇到的问题以及解决方案

报错信息一:ValueError: Unrecognized model in stabilityai/stable-diffusion-2-1. Should have a model_type key in its config.json, or contain one of the following strings in its name: albert, align, altclip, audio-spectrogram-transformer, autoformer, bark, bart, ...

按照官网类似的报错信息,有大佬给出了解决方案:https://github.com/valuesimplex/FinBERT/issues/13

该方案中将原本的model_index.json改为config.json

原始文件夹加了前缀bert_或者其他的

我按照这篇帖子里的指导修改了我的代码,但是又报了别的错误:
报错信息二:OSError: Error no file named pytorch_model.bin, model.safetensors, tf_model.h5, model.ckpt.index or flax_model.msgpack found in directory C:\Users\LLMcode\bert_SDXL-Turbo.

关于这个错误 csdn上也有大佬给出了指导:https://blog.csdn.net/m0_73088444/article/details/143258895

但是我已经将transformers更新到了新的版本,还是报出了错误。

以上这一系列报错信息是我在复现SDXL-Turbo和stable-diffusion-2-1系列大模型过程中遇到的,不确定这个是不是sd系列经常会出现的问题。

我只针对这系列问题来说我自己的解决思路:在hugging face上的model card部分,使用官方给出的读模型代码来导入,我就解决了我的报错问题,关于这一点的详细说明,在我的另一篇帖子有提到,希望能给大家带来借鉴。

原帖链接:https://blog.csdn.net/qq_66536007/article/details/144014720?spm=1001.2014.3001.5502

具体说明截图贴在这里:

相关推荐
moxiaoran575336 分钟前
uni-app学习笔记二十九--数据缓存
笔记·学习·uni-app
AI蜗牛之家1 小时前
Qwen系列之Qwen3解读:最强开源模型的细节拆解
人工智能·python
王上上1 小时前
【论文阅读30】Bi-LSTM(2024)
论文阅读·人工智能·lstm
YunTM2 小时前
贝叶斯优化+LSTM+时序预测=Nature子刊!
人工智能·机器学习
pop_xiaoli2 小时前
OC—UI学习-2
学习·ui·ios
Lin Hsüeh-ch'in3 小时前
Vue 学习路线图(从零到实战)
前端·vue.js·学习
舒一笑3 小时前
智能体革命:企业如何构建自主决策的AI代理?
人工智能
恰薯条的屑海鸥3 小时前
零基础在实践中学习网络安全-皮卡丘靶场(第十五期-URL重定向模块)
学习·安全·web安全·渗透测试·网络安全学习
丁先生qaq4 小时前
热成像实例分割电力设备数据集(3类,838张)
人工智能·计算机视觉·目标跟踪·数据集
红衣小蛇妖4 小时前
神经网络-Day45
人工智能·深度学习·神经网络