bert模型笔记

1.各预训练模型说明

BERT模型在英文数据集上提供了两种大小的模型,Base和Large。Uncased是意味着输入的词都会转变成小写,cased是意味着输入的词会保存其大写(在命名实体识别等项目上需要)。Multilingual是支持多语言的,最后一个是中文预训练模型。

复制代码
在这里我们选择BERT-Base,Uncased。下载下来之后是一个zip文件,解压后有ckpt文件,一个模型参数的json文件,一个词汇表txt文件。

2.参数错误

复制代码
当输出出现 args = parser.parse_args()标红时,将 args = parser.parse_args() 替换为:args, unknown = parser.parse_known_args()

3.命令行转换模型(tf到pytorch)chinese_L-12_H-768_A-12

复制代码
安装:pip install pytorch-pretrained-bert
解压地址:export BERT_BASE_DIR=/path/to/bert/chinese_L-12_H-768_A-12

(地址拼接)转换模型:pytorch_pretrained_bert convert_tf_checkpoint_to_pytorch BERT_BASE_DIR/bert_model.ckpt BERT_BASE_DIR/bert_config.json $BERT_BASE_DIR/pytorch_model.bin

4.bert模型的标签

复制代码
标签默认为0,1,2...n的方式标注,否则需转换。
相关推荐
汤姆yu3 分钟前
OpenAI GPT-5.5 全面详解与使用
人工智能·openai
xcbrand4 分钟前
政府事业机构品牌策划公司哪家可靠
大数据·人工智能·python
逻辑君5 分钟前
认知神经科学研究报告【20260020】
人工智能·神经网络·机器学习
2zcode14 分钟前
基于低光照增强与轻量型CNN道路实时识别算法研究(UI界面+数据集+训练代码)
人工智能·算法·cnn·低光照增强·自动驾驶技术
萑澈26 分钟前
Xiaomi MiMo Orbit 百亿 Token 计划申请保姆级教程
人工智能
缝艺智研社28 分钟前
誉财 YC - 23 全自动上底裤明橡筋机:裤腰加工的革新力量
人工智能·自动化缝纫机·线上模板机·无人自动化产线·线内模板机
北京软秦科技有限公司28 分钟前
工厂到货验收的突破:IACheck如何提升AI报告审核效率
人工智能
LaughingZhu30 分钟前
Product Hunt 每日热榜 | 2026-05-03
人工智能·经验分享·深度学习·神经网络·产品运营
缝艺智研社30 分钟前
誉财 YC - 18 - JG 小型激光模板机:服装缝切工艺的革新先锋
人工智能·新人首发·自动化缝纫机·线上模板机·无人自动化产线
m0_4665252935 分钟前
绿盟科技发布2026年一季报,收入微增,亏损收窄,现金流持续为正
人工智能·科技