机器学习—多个输出的分类(Optional)

宋一诺332024-11-13 20:50

有一种不同类型的分类问题，称为多标签分类问题，与每个图像相关联的地方可能有多个标签。

如果你正在制造一辆自动驾驶汽车或者驾驶辅助系统，然后给你一张车前的照片，你可能想问，比如有没有一辆车或者至少有一辆车还是有公共汽车，还是有行人，所以在这种情况下有一辆车，没有公共汽车，至少有一名行人，或者在第二张照片中，没有车，没有公共汽车，有行人，第三张照片中，有汽车和公共汽车，没有行人，这些是多标签分类问题的例子，因为与单个输入图像x相关联，有三个标签，分别是汽车，公共汽车或行人，所以在这种情况下，目标输出y实际上是一个向量，三个数字，这与多类分类不同，手写数字分类Y只是一个数字，即使这个数字可以有十个不同的可能值。

如何构建多标签分类的神经网络

一种方法是把它看作三个完全独立的机器学习问题，可以建立一个神经网络来决定，第一个检测汽车，第二个检测公交车，第三个是检测行人，这其实不是一个不合理的做法，第一个是检测汽车的神经网络，第二个是检测公交车，第三个检测行人，还有另一种方法，就是训练一个神经网络同时检测三辆车，公共汽车，汽车和行人，如果你的神经网络结构是这样的，X第一隐藏层输出1，第二个隐藏层输出一个2，在这种情况下，最后的输出层会有三个输出神经元，并将输出一个3，它将是一个由三个数字组成的向量，因为正在解决三个二进制分类问题，可以对这三个节点中的每一个节点在输出层使用Z状结肠激活函数，所以在这种情况下，a3分为a31,a32,a33，对应图像中有一辆汽车和一辆公共汽车和行人，因此，多类分类和多标签分类有时会混淆在一起，所以此篇文章只是多标签分类问题的定义。