技术栈

batchsize

颹蕭蕭
1 年前
微调·bert·ner·学习率·batchsize
BERT ner 微调参数的选择针对批大小和学习率的组合进行收敛速度测试,结论:画图代码(deepseek生成):微调命令日志