TensorFlow的transformer类模型文件转换为pytorch

在进行transformer类模型的训练或开发时,我们会在GitHub、huggingface等平台上下载已有的模型文件。个人习惯用pytorch框架进行代码编写,然而很多时候在下载模型文件时,会遇到TensorFlow的模型,这是就涉及到转换的问题。

首先说一说两个框架的模型文件的后缀名区别:

  1. 在TensorFlow中,模型文件常用.ckpt存储
  2. 在pytorch中,模型文件常用.bin存储

以下是TensorFlow转换为pytorch的指令:

bash 复制代码
transformers-cli convert \
--model_type <如bert>\
--tf_checkpoint <原TensorFlow的ckpt文件地址>\
--config <配置json文件地址>\
--pytorch_dump_output <目标pytorch的bin文件地址>

最后补充一下------Transformer类的模型文件 ,其目录下通常都会有:
①模型文件
②模型索引文件
③tokenizer文件
④模型配置的json文件(通常是config.json)
⑤vocab词表

相关推荐
GISer_Jing19 分钟前
AI Agent 智能体系统:A2A通信与资源优化之道
人工智能·aigc
yusur33 分钟前
边缘智算新引擎 DPU 驱动的算力革新
人工智能·科技·rdma·dpu
视觉&物联智能35 分钟前
【杂谈】-企业人工智能的变革与机遇
人工智能·ai·aigc·agi
图生生1 小时前
电商主图快速修改方案:AI工具实现元素自由增删,降低开发与设计成本
人工智能
Deepoch1 小时前
Deepoc具身模型开发板:重新定义机器人智能化的技术底座
人工智能·机器人·具身模型·deepoc
G***技1 小时前
搭载RK3588处理器,IM1-707核心板撑起建筑机器人“精准+高效”
人工智能
lingling0091 小时前
2026 年 BI 发展新趋势:AI 功能如何让数据分析工具 “思考” 和 “对话”?
大数据·人工智能·数据分析
鹧鸪云光伏1 小时前
光伏项目多,如何高效管理?
大数据·人工智能·光伏
weixin_397578021 小时前
LLM应用开发七:Agent进阶
人工智能
谢的2元王国1 小时前
这是跑通实用rag的日志记录 重点关注一点 句子向量化模型的选择 以及召回结果后 重排交叉编码的精进
人工智能·深度学习