TensorFlow的transformer类模型文件转换为pytorch

在进行transformer类模型的训练或开发时,我们会在GitHub、huggingface等平台上下载已有的模型文件。个人习惯用pytorch框架进行代码编写,然而很多时候在下载模型文件时,会遇到TensorFlow的模型,这是就涉及到转换的问题。

首先说一说两个框架的模型文件的后缀名区别:

  1. 在TensorFlow中,模型文件常用.ckpt存储
  2. 在pytorch中,模型文件常用.bin存储

以下是TensorFlow转换为pytorch的指令:

bash 复制代码
transformers-cli convert \
--model_type <如bert>\
--tf_checkpoint <原TensorFlow的ckpt文件地址>\
--config <配置json文件地址>\
--pytorch_dump_output <目标pytorch的bin文件地址>

最后补充一下------Transformer类的模型文件 ,其目录下通常都会有:
①模型文件
②模型索引文件
③tokenizer文件
④模型配置的json文件(通常是config.json)
⑤vocab词表

相关推荐
l112206031 分钟前
GEO 优化公司选品指南:江苏一网推的阶梯式服务核心竞争力
大数据·人工智能
格林威3 分钟前
工业相机图像高速存储(C++版):直接IO存储方法,附海康相机实战代码!
开发语言·c++·人工智能·数码相机·计算机视觉·视觉检测·工业相机
aZhe的全栈知识分享6 分钟前
OpenClaw(龙虾)太难装?这份保姆级教程让你 3 分钟搞定
前端·人工智能·后端
东离与糖宝7 分钟前
315警示:AI接口被恶意调用?Java高并发+限流+鉴权防护实战
java·人工智能
Bruce_Liuxiaowei8 分钟前
深入浅出:清理 OpenClaw 会话记录的完整操作解析
人工智能·大模型·智能体·openclaw
用户48159301959110 分钟前
买东西总是刚下单就降价?本文以 **`price-watch`(商品降价监控器)** 为例,手把手带你写一个真正有用的 OpenClaw Skill,从零开始到
人工智能
chatexcel16 分钟前
什么是AI的SOUL?如何定制专属AI助理
大数据·人工智能
CrystalShaw16 分钟前
[AI codec]opus-1.6\dnn包含算法汇总和文件功能分类
人工智能·算法·dnn
仙女修炼史17 分钟前
Copy-Past 解决小目标检测问题
人工智能·目标检测·计算机视觉
2301_7644413319 分钟前
ProjectAIRI:是一个开源的AI虚拟数字人伴侣
人工智能·目标检测·自然语言处理·开源·视觉检测·语音识别