技术栈

模型泛化

_Meilinger_
8 天前
机器学习基础·少样本学习·过拟合·欠拟合·模型泛化·高方差·bias-variance
碎片笔记|样本少不等于欠拟合:从 Few-shot 任务理解过拟合与欠拟合前言:刚刚在和外导 meeting 时,触及到一个之前没有深入思考的问题:few-shot 场景下训练分类器,到底更容易导致过拟合还是欠拟合?本文围绕这一问题展开讨论:先区分过拟合与欠拟合,再分析样本数量、模型复杂度和特征空间之间的关系,最后给出相应的诊断思路和解决方案。
loveisastory
2 年前
bert·mindspore·模型训练·情绪识别·模型验证·模型推理·模型泛化
昇思25天学习打卡营第11天 | LLM原理和实践:基于MindSpore实现BERT对话情绪识别BERT全称是来自变换器的双向编码器表征量(Bidirectional Encoder Representations from Transformers),它是Google于2018年末开发并发布的一种新型语言模型。与BERT模型相似的预训练语言模型例如问答、命名实体识别、自然语言推理、文本分类等在许多自然语言处理任务中发挥着重要作用。模型是基于Transformer中的Encoder并加上双向的结构,因此一定要熟练掌握Transformer的Encoder的结构。
我是有底线的