吴恩达《机器学习》10-6-10-7:学习曲线、决定下一步做什么

学习曲线将训练集误差和交叉验证集误差作为训练集实例数量（m）的函数绘制而成。这意味着从较少的数据开始，逐渐增加训练集的实例数量。该方法的核心思想在于，当训练较少数据时，模型可能会完美地适应这些数据，但这并不代表它能够很好地适应交叉验证集或测试集数据。

在学习曲线中，对于高偏差或欠拟合的情况，增加训练集数据可能不会显著改善模型效果。具体而言，如果使用一条直线模型适应数据，无论训练集有多大，模型的误差都可能保持较高，表现出学习曲线趋于平稳。

对于高方差或过拟合的情况，学习曲线呈现出一种特殊的模式。当交叉验证集误差远大于训练集误差时，增加更多数据到训练集可能有助于提高算法效果。高方差情况下，模型在训练集上表现很好，但泛化到未见数据时表现不佳。

学习曲线不仅仅是一种工具，更是算法性能的"合理检验"。通过观察曲线的形状，我们可以快速判断算法的问题所在，是偏差还是方差。这为调整算法提供了重要线索，指导我们如何改进模型的性能。

在机器学习中，选择下一步的操作至关重要，而之前学到的诊断法则可以帮助更好地判断应该采取哪些方法来改进学习算法的效果。在这个过程中，可以回顾六种可选的下一步，并根据问题的性质进行选择：

对于神经网络，调整网络的大小和正则化程度也是一项重要任务。较小的神经网络可能导致高偏差，而较大的神经网络可能导致高方差。通过逐步增加隐藏层的层数，可以使用交叉验证集选择最佳的网络结构。

参考资料：