TensorFlow的transformer类模型文件转换为pytorch

在进行transformer类模型的训练或开发时,我们会在GitHub、huggingface等平台上下载已有的模型文件。个人习惯用pytorch框架进行代码编写,然而很多时候在下载模型文件时,会遇到TensorFlow的模型,这是就涉及到转换的问题。

首先说一说两个框架的模型文件的后缀名区别:

  1. 在TensorFlow中,模型文件常用.ckpt存储
  2. 在pytorch中,模型文件常用.bin存储

以下是TensorFlow转换为pytorch的指令:

bash 复制代码
transformers-cli convert \
--model_type <如bert>\
--tf_checkpoint <原TensorFlow的ckpt文件地址>\
--config <配置json文件地址>\
--pytorch_dump_output <目标pytorch的bin文件地址>

最后补充一下------Transformer类的模型文件 ,其目录下通常都会有:
①模型文件
②模型索引文件
③tokenizer文件
④模型配置的json文件(通常是config.json)
⑤vocab词表

相关推荐
beyond阿亮1 分钟前
OpenClaw在Windows上接入飞书完整指南
人工智能·windows·ai·openclaw
ybdesire1 分钟前
通过训练代码来理解DLLM扩散语言模型
人工智能·语言模型·自然语言处理
多年小白1 分钟前
Anthropic发布Mythos模型:为什么网络安全板块先跌为敬
网络·人工智能·科技·ai编程
爱丽_3 分钟前
多因素最优解到梯度下降:AI 训练的数学主线
人工智能
网络工程小王7 分钟前
【Python数据分析基础】
大数据·数据库·人工智能·学习
skilllite作者10 分钟前
开源项目推荐SkillLite,项目取得阶段性成果总结
人工智能
二十雨辰17 分钟前
[RAG]-智能体开发
人工智能·ai
第七页独白24 分钟前
全星研发项目管理 APQP 软件系统:驱动高端制造研发数智化升级
人工智能
FluxMelodySun24 分钟前
机器学习(二十七) 降维:度量学习与随机梯度下降法求解
人工智能·学习·机器学习
蒸汽求职27 分钟前
【蒸汽教育求职干货】OPT只剩3个月还没找到工作,怎么办?——留学生IT求职的“紧急预案”
人工智能·经验分享·面试·职场和发展·美国求职