技术栈
batchsize
颹蕭蕭
5 个月前
微调
·
bert
·
ner
·
学习率
·
batchsize
BERT ner 微调参数的选择
针对批大小和学习率的组合进行收敛速度测试,结论:画图代码(deepseek生成):微调命令日志