bert模型笔记

1.各预训练模型说明

BERT模型在英文数据集上提供了两种大小的模型,Base和Large。Uncased是意味着输入的词都会转变成小写,cased是意味着输入的词会保存其大写(在命名实体识别等项目上需要)。Multilingual是支持多语言的,最后一个是中文预训练模型。

复制代码
在这里我们选择BERT-Base,Uncased。下载下来之后是一个zip文件,解压后有ckpt文件,一个模型参数的json文件,一个词汇表txt文件。

2.参数错误

复制代码
当输出出现 args = parser.parse_args()标红时,将 args = parser.parse_args() 替换为:args, unknown = parser.parse_known_args()

3.命令行转换模型(tf到pytorch)chinese_L-12_H-768_A-12

复制代码
安装:pip install pytorch-pretrained-bert
解压地址:export BERT_BASE_DIR=/path/to/bert/chinese_L-12_H-768_A-12

(地址拼接)转换模型:pytorch_pretrained_bert convert_tf_checkpoint_to_pytorch BERT_BASE_DIR/bert_model.ckpt BERT_BASE_DIR/bert_config.json $BERT_BASE_DIR/pytorch_model.bin

4.bert模型的标签

复制代码
标签默认为0,1,2...n的方式标注,否则需转换。
相关推荐
青橘MATLAB学习10 分钟前
机器学习核心知识:从基础概念到关键算法
人工智能·算法·机器学习·逻辑回归·监督学习·梯度下降法·分类算法
贝塔西塔10 分钟前
生成对抗网络(GAN)原理详解
人工智能·深度学习·生成对抗网络
爱喝热水的呀哈喽10 分钟前
vim笔记
笔记·编辑器·vim
体育分享_大眼18 分钟前
足球AI模型:一款用数据分析赛事的模型
人工智能·数据挖掘·数据分析
loinleeai32 分钟前
【PyTorch】PyTorch中的非线性激活函数详解:原理、优缺点与实战指南
人工智能·pytorch·python·神经网络·目标检测·机器学习·计算机视觉
2401_8786247935 分钟前
opencv图片颜色识别
人工智能·opencv·计算机视觉
云布道师38 分钟前
基于PAI+专属网关+私网连接:构建全链路 Deepseek 云上私有化部署与模型调用架构
人工智能·阿里云·云计算·云布道师
OpenVINO生态社区1 小时前
【机器人创新创业应需明确产品定位与方向指南】
人工智能·机器人
天水幼麟1 小时前
Python学习笔记
笔记·python·学习
凤年徐1 小时前
【C/C++】深入理解指针(二)
c语言·开发语言·c++·经验分享·笔记·指针