Transformer模型转换:从TF到PyTorch的实战指南

场景

使用tensorflow将TF模型转化成PyTorch模型

步骤

获取如下三个文件:

这里假设已经安装过PyTorch了。

开始转化TF2模型位PyTorch模型:

复制代码
# 安装依赖
pip3 install tensorflow transformers
export BERT_BASE_DIR=~/Downloads/nlp_bert/multi_cased_L-12_H-768_A-12
transformers-cli convert --model_type bert \
  --tf_checkpoint $BERT_BASE_DIR/bert_model.ckpt \
  --config $BERT_BASE_DIR/bert_config.json \
  --pytorch_dump_output $BERT_BASE_DIR/pytorch_model.bin

这里的pytorch_model.bin就是TF2的已经训练好的模型转化过来的PyTorch模型。

参考:

相关推荐
海边夕阳20064 小时前
【每天一个AI小知识】:什么是卷积神经网络?
人工智能·经验分享·深度学习·神经网络·机器学习·cnn
爱跑步的george7 小时前
时间序列预测的“诸神之战”:树模型 (XGB/LGBM) vs 深度学习(Transformer/RNN) 的工业界大对决
深度学习
PyAIGCMaster8 小时前
如何编译一个apk,我是新手
深度学习·学习
清云逸仙8 小时前
什么是AI领域的Prompt
人工智能·深度学习·机器学习·prompt
背影疾风9 小时前
基于深度学习的3D点云特征提取方法梳理
人工智能·深度学习·3d·自动驾驶
only-code11 小时前
Fast-DetectGPT:用“条件概率曲率”拆穿 AI 伪装的文本
人工智能·深度学习·机器学习·ai大模型·论文解读·ai检测·文本检测
qy-ll12 小时前
最新MMO-IG生成图像论文学习(25/11/19)
图像处理·深度学习·学习·计算机视觉·论文学习·遥感
啦啦啦在冲冲冲14 小时前
lora矩阵的初始化为啥B矩阵为0呢,为啥不是A呢
深度学习·机器学习·矩阵
拾零吖14 小时前
Attention by 3B1B
人工智能·深度学习·机器学习