TensorFlow的transformer类模型文件转换为pytorch

在进行transformer类模型的训练或开发时,我们会在GitHub、huggingface等平台上下载已有的模型文件。个人习惯用pytorch框架进行代码编写,然而很多时候在下载模型文件时,会遇到TensorFlow的模型,这是就涉及到转换的问题。

首先说一说两个框架的模型文件的后缀名区别:

  1. 在TensorFlow中,模型文件常用.ckpt存储
  2. 在pytorch中,模型文件常用.bin存储

以下是TensorFlow转换为pytorch的指令:

bash 复制代码
transformers-cli convert \
--model_type <如bert>\
--tf_checkpoint <原TensorFlow的ckpt文件地址>\
--config <配置json文件地址>\
--pytorch_dump_output <目标pytorch的bin文件地址>

最后补充一下------Transformer类的模型文件 ,其目录下通常都会有:
①模型文件
②模型索引文件
③tokenizer文件
④模型配置的json文件(通常是config.json)
⑤vocab词表

相关推荐
学点程序2 分钟前
Manifest:帮个人 AI Agent 降低模型成本的开源路由器
人工智能·开源
可观测性用观测云10 分钟前
观测云 x AI Agent:运维智能化的范式跃迁实践
人工智能
数数科技的数据干货12 分钟前
ThinkingAI携手华为云,共建企业级AI Agent平台Agentic Engine
人工智能·ai·华为云·agent
人工智能AI技术14 分钟前
春招急救:7天面试突击方案
人工智能
2603_9547083124 分钟前
如何确保微电网标准化架构设计流程的完整性?
网络·人工智能·物联网·架构·系统架构
小小AK30 分钟前
钉钉与金蝶云星空无缝集成方案
大数据·人工智能·钉钉
不停喝水34 分钟前
【AI+Cursor】 告别切图仔,拥抱Vibe Coding: AI + Cursor 开启多模态全栈新纪元 (1)
前端·人工智能·后端·ai·ai编程·cursor
水如烟1 小时前
孤能子视角:AI智能原理,“所有智能,都是茧房里的耦合“,以及人的主场
人工智能
Xxtaoaooo1 小时前
【开源】灵魂讲述者:基于魔珐星云的AI交互式分支叙事应用,免费体验啦!
人工智能·开源·ai数字人·魔法星云·小说创作
2401_865382501 小时前
AI询价与传统询价平台的区别
人工智能·信息化项目·政务信息化·信息化造价