在复现SDXL-Turbo和stable-diffusion-2-1系列大模型过程中遇到的问题以及解决方案

报错信息一:ValueError: Unrecognized model in stabilityai/stable-diffusion-2-1. Should have a model_type key in its config.json, or contain one of the following strings in its name: albert, align, altclip, audio-spectrogram-transformer, autoformer, bark, bart, ...

按照官网类似的报错信息,有大佬给出了解决方案:https://github.com/valuesimplex/FinBERT/issues/13

该方案中将原本的model_index.json改为config.json

原始文件夹加了前缀bert_或者其他的

我按照这篇帖子里的指导修改了我的代码,但是又报了别的错误:
报错信息二:OSError: Error no file named pytorch_model.bin, model.safetensors, tf_model.h5, model.ckpt.index or flax_model.msgpack found in directory C:\Users\LLMcode\bert_SDXL-Turbo.

关于这个错误 csdn上也有大佬给出了指导:https://blog.csdn.net/m0_73088444/article/details/143258895

但是我已经将transformers更新到了新的版本,还是报出了错误。

以上这一系列报错信息是我在复现SDXL-Turbo和stable-diffusion-2-1系列大模型过程中遇到的,不确定这个是不是sd系列经常会出现的问题。

我只针对这系列问题来说我自己的解决思路:在hugging face上的model card部分,使用官方给出的读模型代码来导入,我就解决了我的报错问题,关于这一点的详细说明,在我的另一篇帖子有提到,希望能给大家带来借鉴。

原帖链接:https://blog.csdn.net/qq_66536007/article/details/144014720?spm=1001.2014.3001.5502

具体说明截图贴在这里:

相关推荐
koo36413 小时前
李宏毅机器学习笔记43
人工智能·笔记·机器学习
lzjava202413 小时前
Spring AI使用知识库增强对话功能
人工智能·python·spring
Francek Chen14 小时前
【自然语言处理】预训练05:全局向量的词嵌入(GloVe)
人工智能·pytorch·深度学习·自然语言处理·glove
这张生成的图像能检测吗14 小时前
(论文速读)LyT-Net:基于YUV变压器的轻量级微光图像增强网络
图像处理·人工智能·计算机视觉·低照度
snakecy14 小时前
系统架构设计师学习大纲目录
学习·系统架构
im_AMBER14 小时前
React 15
前端·javascript·笔记·学习·react.js·前端框架
许泽宇的技术分享14 小时前
AI黑客来袭:Strix如何用大模型重新定义渗透测试游戏规则
人工智能
Oxo Security14 小时前
【AI安全】检索增强生成(RAG)
人工智能·安全·网络安全·ai
少林码僧14 小时前
2.3 Transformer 变体与扩展:BERT、GPT 与多模态模型
人工智能·gpt·ai·大模型·bert·transformer·1024程序员节
shayudiandian14 小时前
如何使用 DeepSeek 帮助自己的工作
人工智能