transformer不同的包加载模型的结构不一样

AutoModel

AutoModelForTokenClassification


结论:

AutoModel加载的模型与AutoModelForTokenClassification最后一层是不一样的,从这个模型来看,AutoModelForTokenClassification加载的结果是对的

问题:

为什么AutoModel和AutoModelForTokenClassification加载的结果不一样?

相关推荐
赋创小助手2 分钟前
超微SYS-821GE-TNHR深度测评:8卡 NVIDIA H200 风冷 AI 服务器
运维·服务器·人工智能·深度学习·计算机视觉·语言模型·自然语言处理
znhy_2311 分钟前
day45打卡
python·深度学习·机器学习
HyperAI超神经37 分钟前
【vLLM 学习】Profiling
人工智能·深度学习·学习·cpu·gpu·编程语言·vllm
阿正的梦工坊1 小时前
论文阅读WebDancer: Towards Autonomous Information Seeking Agency
论文阅读·人工智能·深度学习·机器学习·llm
鲨莎分不晴1 小时前
解构“深度折叠” (Deep Folding):当深度学习遇见生命之书
人工智能·深度学习
无心水1 小时前
【神经风格迁移:性能】24、神经风格迁移全链路监控实战:基于Prometheus+Grafana的性能调优指南
数据库·人工智能·深度学习·机器学习·grafana·prometheus·神经风格迁移:性能
Hcoco_me1 小时前
大模型面试题19:梯度消失&梯度爆炸 公式版
人工智能·rnn·深度学习·自然语言处理·word2vec
All The Way North-1 小时前
全连接神经网络基本概念详解:输入输入、维度理解、权重矩阵、神经元个数
人工智能·pytorch·深度学习·神经网络·全连接神经网络
过期的秋刀鱼!10 小时前
人工智能-深度学习-线性回归
人工智能·深度学习
IE0611 小时前
深度学习系列84:使用kokoros生成tts语音
人工智能·深度学习