使用LLM模型的tokenizer报错AttributeError: ‘dict‘ object has no attribute ‘model_type‘

代码

python 复制代码
from transformers import AutoTokenizer
...
model_path = "/.../models/Qwen/Qwen2.5-0.5B-Instruct"
    train_data_path = "/...dataset/datasettrain.json"
    tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

报错:

plaintext 复制代码
AttributeError: 'dict' object has no attribute 'model_type'

解决方法:

把transformers版本改一下。(报错时我使用的是transformers== 4.57.2)

改成transformers==4.57.1即可

参考地址:

https://github.com/vllm-project/vllm/issues/29368

相关推荐
2501_941805313 小时前
从微服务网关到统一安全治理的互联网工程语法实践与多语言探索
前端·python·算法
汗流浃背了吧,老弟!3 小时前
Transformer-初识
人工智能·深度学习·transformer
Lkygo3 小时前
Embedding 和 Reranker 模型
人工智能·embedding·vllm·sglang
竹君子3 小时前
英伟达的AI芯片架构演进的三个阶段
人工智能
Chris_12193 小时前
Halcon学习笔记-Day5
人工智能·笔记·python·学习·机器学习·halcon
蓝程序3 小时前
Spring AI学习 程序接入大模型
java·人工智能·spring
西柚小萌新3 小时前
【论文阅读】--PEACE:基于多模态大语言模型的地质图全息理解赋能框架
人工智能·语言模型·自然语言处理
2501_941800883 小时前
从微服务限流到系统稳定性的互联网工程语法实践与多语言探索
开发语言·python
GalenZhang8883 小时前
使用 Python SDK 将数据写入飞书多维表格
数据库·python·飞书·多维表格
Ai野生菌3 小时前
论文解读 | 当“提示词”学会绕路:用拓扑学方法一次击穿多智能体安全防线
人工智能·深度学习·安全·语言模型·拓扑学