Transformer模型转换:从TF到PyTorch的实战指南

场景

使用tensorflow将TF模型转化成PyTorch模型

步骤

获取如下三个文件:

这里假设已经安装过PyTorch了。

开始转化TF2模型位PyTorch模型:

复制代码
# 安装依赖
pip3 install tensorflow transformers
export BERT_BASE_DIR=~/Downloads/nlp_bert/multi_cased_L-12_H-768_A-12
transformers-cli convert --model_type bert \
  --tf_checkpoint $BERT_BASE_DIR/bert_model.ckpt \
  --config $BERT_BASE_DIR/bert_config.json \
  --pytorch_dump_output $BERT_BASE_DIR/pytorch_model.bin

这里的pytorch_model.bin就是TF2的已经训练好的模型转化过来的PyTorch模型。

参考:

相关推荐
冬虫夏草199342 分钟前
使用householder反射推广ROPE相对位置编码
人工智能·pytorch·python
LCG米1 小时前
从训练到部署:基于PyTorch与TensorFlow Lite的端侧AI花卉分类系统完整指南
人工智能·pytorch·tensorflow
懂AI的老郑1 小时前
Transformer架构在大语言模型中的优化技术:原理、方法与前沿
语言模型·架构·transformer
金融小师妹1 小时前
机器学习驱动分析:ADP就业数据异常波动,AI模型预测12月降息概率达89%
大数据·人工智能·深度学习·编辑器·1024程序员节
东皇太星2 小时前
Transformers Tokenizer 使用详解
人工智能·rnn·深度学习·神经网络
CV爱数码2 小时前
【宝藏数据集】LUMOS:腰椎多模态骨质疏松症筛查专用
人工智能·python·深度学习·机器学习·计算机视觉·数据集
技术小黑2 小时前
Pytorch学习系列07 | VGG-16算法实现马铃薯病害识别
pytorch·深度学习·神经网络·cnn
严文文-Chris2 小时前
神经网络的组成有哪些?激活函数是什么?有什么作用?
人工智能·深度学习·神经网络
渡我白衣2 小时前
多路转接模型与select
人工智能·深度学习·websocket·网络协议·机器学习·网络安全·信息与通信
菩提树下的凡夫3 小时前
Yolov11的空标注负样本技术在模型训练中的应用
人工智能·深度学习·yolo