Transformer模型转换:从TF到PyTorch的实战指南

场景

使用tensorflow将TF模型转化成PyTorch模型

步骤

获取如下三个文件:

这里假设已经安装过PyTorch了。

开始转化TF2模型位PyTorch模型:

复制代码
# 安装依赖
pip3 install tensorflow transformers
export BERT_BASE_DIR=~/Downloads/nlp_bert/multi_cased_L-12_H-768_A-12
transformers-cli convert --model_type bert \
  --tf_checkpoint $BERT_BASE_DIR/bert_model.ckpt \
  --config $BERT_BASE_DIR/bert_config.json \
  --pytorch_dump_output $BERT_BASE_DIR/pytorch_model.bin

这里的pytorch_model.bin就是TF2的已经训练好的模型转化过来的PyTorch模型。

参考:

相关推荐
人工智能培训12 小时前
什么是量子强化学习
人工智能·深度学习
智算菩萨13 小时前
音乐生成模型综述:从符号作曲到音频域大模型、评测体系与产业化趋势
人工智能·深度学习·算法
cvyoutian13 小时前
PyTorch 多卡训练常见坑:设置 CUDA_VISIBLE_DEVICES 后仍 OOM 在 GPU 0 的解决之道
人工智能·pytorch·python
落雪snowflake13 小时前
compute_entropy函数
pytorch·python·深度学习
HPC_C13 小时前
TVM: An Automated End-to-End Optimizing Compiler for Deep Learning
人工智能·深度学习
oraen13 小时前
深度学习基础与概念笔记
人工智能·深度学习
盼小辉丶15 小时前
Transformer实战(31)——解释Transformer模型决策
深度学习·transformer·可解释人工智能
渡我白衣16 小时前
AI应用层革命(七)——智能体的终极形态:认知循环体的诞生
人工智能·深度学习·神经网络·目标检测·microsoft·机器学习·自然语言处理
workflower21 小时前
时序数据获取事件
开发语言·人工智能·python·深度学习·机器学习·结对编程
java1234_小锋1 天前
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 编码器(Encoder)详解以及算法实现
深度学习·语言模型·transformer