transformer不同的包加载模型的结构不一样

AutoModel

AutoModelForTokenClassification


结论:

AutoModel加载的模型与AutoModelForTokenClassification最后一层是不一样的,从这个模型来看,AutoModelForTokenClassification加载的结果是对的

问题:

为什么AutoModel和AutoModelForTokenClassification加载的结果不一样?

相关推荐
AI人工智能+19 分钟前
表格识别技术:实现复杂表格内容的精准解析与表格结构的版面还原,推动档案管理从数字化存储向智能化服务转型
深度学习·ocr·表格识别
Hcoco_me1 小时前
大模型面试题75:讲解一下GRPO的数据回放
人工智能·深度学习·算法·机器学习·vllm
高洁012 小时前
AIGC技术与进展(1)
深度学习·算法·机器学习·transformer·知识图谱
PeterClerk2 小时前
计算机视觉常用指标(Metrics)速查与解释(持续更新)
人工智能·python·深度学习·计算机视觉·benchmark·评测
算法狗22 小时前
大模型面试题:有以下哪些方式可以在 prompt 中插入指令?
人工智能·深度学习·机器学习·语言模型·面试题
Hcoco_me3 小时前
大模型面试题76:强化学习中on-policy和off-policy的区别是什么?
人工智能·深度学习·算法·transformer·vllm
嘉嘉嘉7174 小时前
【day 52】神经网络调参指南
python·深度学习·机器学习
renhongxia15 小时前
大型语言模型性能预测器:学习何时在混合人机-人工智能管理系统中升级
人工智能·深度学习·学习·机器学习·语言模型·自然语言处理
brent4235 小时前
DAY52 通道注意力(SE注意力)
人工智能·深度学习·计算机视觉
Hcoco_me5 小时前
大模型面试题74:在使用GRPO训练LLM时,训练数据有什么要求?
人工智能·深度学习·算法·机器学习·chatgpt·机器人