transformer不同的包加载模型的结构不一样

AutoModel

AutoModelForTokenClassification


结论:

AutoModel加载的模型与AutoModelForTokenClassification最后一层是不一样的,从这个模型来看,AutoModelForTokenClassification加载的结果是对的

问题:

为什么AutoModel和AutoModelForTokenClassification加载的结果不一样?

相关推荐
蒋星熠1 小时前
如何在Anaconda中配置你的CUDA & Pytorch & cuNN环境(2025最新教程)
开发语言·人工智能·pytorch·python·深度学习·机器学习·ai
小彭律师2 小时前
基于因果推理与Transformer的金融理财产品智能推荐系统
深度学习·金融·transformer
Hcoco_me3 小时前
深度学习和神经网络之间有什么区别?
人工智能·深度学习·神经网络
西安光锐软件3 小时前
深度学习之损失函数
人工智能·深度学习
astragin3 小时前
神经网络常见层速查表
人工智能·深度学习·神经网络
cyyt3 小时前
深度学习周报(9.8~9.14)
人工智能·深度学习
扯淡的闲人3 小时前
多语言编码Agent解决方案(2)-后端服务实现
开发语言·python·深度学习
蒋星熠3 小时前
深度学习实战指南:从神经网络基础到模型优化的完整攻略
人工智能·python·深度学习·神经网络·机器学习·卷积神经网络·transformer
丁学文武6 小时前
FlashAttention(V2)深度解析:从原理到工程实现
人工智能·深度学习·大模型应用·flashattention
大千AI助手6 小时前
Dropout:深度学习中的随机丢弃正则化技术
人工智能·深度学习·神经网络·模型训练·dropout·正则化·过拟合