使用LLM模型的tokenizer报错AttributeError: ‘dict‘ object has no attribute ‘model_type‘

代码

python 复制代码
from transformers import AutoTokenizer
...
model_path = "/.../models/Qwen/Qwen2.5-0.5B-Instruct"
    train_data_path = "/...dataset/datasettrain.json"
    tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

报错:

plaintext 复制代码
AttributeError: 'dict' object has no attribute 'model_type'

解决方法:

把transformers版本改一下。(报错时我使用的是transformers== 4.57.2)

改成transformers==4.57.1即可

参考地址:

https://github.com/vllm-project/vllm/issues/29368

相关推荐
Bruce_Liuxiaowei1 分钟前
WorkBuddy案例——自动化内容创作平台
人工智能·ai·大模型·智能体·workbuddy
shchojj3 分钟前
Advanced Technologies: Beyond Prompting -- Retrieval Augmented Generation(RAG)
人工智能
狒狒热知识5 分钟前
软文营销底层逻辑重构专业发稿平台成品牌流量核心抓手
人工智能
fan65404146 分钟前
GEO服务商技术评估的四维量化框架:以杭州文澜天下科技为例
运维·人工智能·科技
沪漂阿龙6 分钟前
面试题详解:大模型思维链 CoT 推理模型训练全解析——如何微调出带思维链的 LLM、优缺点、SFT 与 RLHF 能不能跳过
人工智能
2601_958352907 分钟前
A-68双麦波束模组深度解析:90dB降噪、60°夹角、3-5米拾音,一篇讲透
人工智能·语音识别·嵌入式开发·音频降噪·回音消除
事变天下9 分钟前
奥哲重构电建新范式!AI赋能电力建设全场景智能化升级
大数据·人工智能
翼龙云_cloud10 分钟前
腾讯云代理商:腾讯云 AI 算力成本全解析 从技术原理到价格优化策略
人工智能·云计算·腾讯云
浩瀚之水_csdn11 分钟前
机器学习性能评估指数之Dice系数
人工智能·计算机视觉·目标跟踪
闵孚龙12 分钟前
AI 应用开发到底在开发什么?
人工智能