transformer不同的包加载模型的结构不一样

AutoModel

AutoModelForTokenClassification


结论:

AutoModel加载的模型与AutoModelForTokenClassification最后一层是不一样的,从这个模型来看,AutoModelForTokenClassification加载的结果是对的

问题:

为什么AutoModel和AutoModelForTokenClassification加载的结果不一样?

相关推荐
ZHANG8023ZHEN3 小时前
深度学习中的正则化和归一化
人工智能·深度学习
有Li3 小时前
用于体积医学图像分割的跨视角差异依赖网络|文献速递--基于多模态-半监督深度学习的病理学诊断与病灶分割
人工智能·深度学习·计算机视觉
浊酒南街3 小时前
吴恩达深度学习笔记:卷积神经网络(Foundations of Convolutional Neural Networks)2.3-2.4
笔记·深度学习·cnn
清图3 小时前
新书推荐——《深度学习精粹与PyTorch实践》
人工智能·pytorch·深度学习
洋葱蚯蚓6 小时前
深入理解人工智能:从机器学习到深度学习
人工智能·深度学习·机器学习
AI知识分享官6 小时前
大模型增量训练--基于transformer制作一个大模型聊天机器人
人工智能·深度学习·算法·数据挖掘·langchain·机器人·transformer
吃什么芹菜卷6 小时前
深度学习:卷积神经网络CNN
人工智能·笔记·深度学习·cnn
乐事layz6 小时前
对比学习训练是如何进行的
深度学习·学习·机器学习
Terry Cao 漕河泾7 小时前
原文翻译:Make Skeleton-based Action Recognition Model Smaller, Faster and Better
人工智能·深度学习·目标检测·计算机视觉·3d·手势时别
方世恩7 小时前
【深度学习】(8)--神经网络使用最优模型
人工智能·pytorch·深度学习·神经网络·卷积神经网络