TensorFlow的transformer类模型文件转换为pytorch

在进行transformer类模型的训练或开发时,我们会在GitHub、huggingface等平台上下载已有的模型文件。个人习惯用pytorch框架进行代码编写,然而很多时候在下载模型文件时,会遇到TensorFlow的模型,这是就涉及到转换的问题。

首先说一说两个框架的模型文件的后缀名区别:

  1. 在TensorFlow中,模型文件常用.ckpt存储
  2. 在pytorch中,模型文件常用.bin存储

以下是TensorFlow转换为pytorch的指令:

bash 复制代码
transformers-cli convert \
--model_type <如bert>\
--tf_checkpoint <原TensorFlow的ckpt文件地址>\
--config <配置json文件地址>\
--pytorch_dump_output <目标pytorch的bin文件地址>

最后补充一下------Transformer类的模型文件 ,其目录下通常都会有:
①模型文件
②模型索引文件
③tokenizer文件
④模型配置的json文件(通常是config.json)
⑤vocab词表

相关推荐
LiFileHub几秒前
神经网络全栈指南:从经典架构到NL范式落地(附12套工程化模板)
人工智能
AI_56786 分钟前
智慧交通:基于边缘计算的信号灯智能调度系统
人工智能·边缘计算
min18112345611 分钟前
因果推理在机器学习中的集成路径
人工智能
小鸡吃米…16 分钟前
机器学习——生态系统
人工智能·机器学习
说私域23 分钟前
基于开源AI大模型、AI智能名片与商城小程序的购物中心“人货场车”全面数字化解决方案研究
人工智能·小程序·开源
丝斯201124 分钟前
AI学习笔记整理(38)——自然语言处理的‌基于深度学习的语言模型
人工智能·学习·自然语言处理
小毅&Nora26 分钟前
【人工智能】【大模型】大语言模型最新进展:2025年技术演进与实用指南
人工智能·语言模型·自然语言处理
Codebee26 分钟前
惊了!ooder-org藏提示词彩蛋|AI驱动工程典范,1小时焕新DSM全靠A2UI
人工智能·编程语言·全栈
Coder_Boy_29 分钟前
基于SpringAI的智能平台基座开发-(二)
java·人工智能·springboot·aiops·langchain4j
编码小哥30 分钟前
OpenCV轮廓检测与绘制实战
人工智能·opencv·计算机视觉