模型泛化

碎片笔记｜样本少不等于欠拟合：从 Few-shot 任务理解过拟合与欠拟合前言：刚刚在和外导 meeting 时，触及到一个之前没有深入思考的问题：few-shot 场景下训练分类器，到底更容易导致过拟合还是欠拟合？本文围绕这一问题展开讨论：先区分过拟合与欠拟合，再分析样本数量、模型复杂度和特征空间之间的关系，最后给出相应的诊断思路和解决方案。

昇思25天学习打卡营第11天 | LLM原理和实践：基于MindSpore实现BERT对话情绪识别BERT全称是来自变换器的双向编码器表征量（Bidirectional Encoder Representations from Transformers），它是Google于2018年末开发并发布的一种新型语言模型。与BERT模型相似的预训练语言模型例如问答、命名实体识别、自然语言推理、文本分类等在许多自然语言处理任务中发挥着重要作用。模型是基于Transformer中的Encoder并加上双向的结构，因此一定要熟练掌握Transformer的Encoder的结构。

我是有底线的