LLM：badcase分析

灵海之森2024-10-22 8:44

bad case分析是了解业务、了解场景的重要途径，知道当前研究、实践中容易出现的问题，往通俗的说，吸收经验的重要途径。

分析badcase必须要先了解目前模型的效果，也就是baseline，知道该往哪个方向努力。

要兼顾数量、统计意义、质量。

指标的设计必须要考虑观测的目标。

注重指标的口径，比如不同数据源的情况。

多个指标的组合观测。

确定预期的目标、进一步优化我们当前的算法方案的方向。

根据优化算法的方面来观察不利于指标提升的badcase。

大体上去看，错误的样本都有什么特点，带有哪些特征，例如长度、句式等是否有什么特点。

对一个case，重现整个训练和预测过程的方法。给定一个bad case，准备好日志，分析预测的每个阶段的分析结果，查看是否符合预期。

增广数据

不同的阈值得到的召回不一样

预处理的本质是对数据进行处理使之更好地被用来预测

指模型预测之前的处理，尤其在模型比较大，性能要求比较高的场景，我们需要把一些肯定确定能快速预测出来的东西给过滤掉，从而提升性能也降低模型的负担，最简单的例如黑白名单，复杂的可以有一些针对业务的规则，例如超短句或者超长句直接拒绝等等，能用规则的尽量用规则。

指在模型预测以后的一些调整，最直接能想到的就是阈值过滤，但不仅是这些，有的时候需要结合模型的预测打分进行调整