基于FCN网络实现的多类别图像分割任务

1、前言

FCN 作为图像分割的开山之作，将分割任务作为逐个像素点的分类任务

之前完成了基于unet、resnet+unet、deeplab等等网络的分割任务，具体的可以参考本专栏：

图像分割_听风吹等浪起的博客-CSDN博客

因为FCN网络的实现较为复杂，当然有很多现成的代码实现FCN分割网络。不过torchvision中其实已经封装好了，这里我们直接利用这个torchvision完成即可

2、具体实现的思路

这里介绍代码实现的逻辑，具体的参考之前文章

2.1 数据处理

首先是对数据的处理，因为要完成的分割是属于有监督学习，并且label是和数据同样size的灰度图像，所以两者间的对应特别重要

有的label标签是全黑的，或者是那种白色区域很明显的，其实都是一样的。

因为图像分割是逐个像素点的分类任务，而你把分类的值设为1（全黑）或者255（白色区域）其实是一样的，只不过加载数据的时候需要处理下

这里还是使用之前博文unet处理的方式，通过便利mask图像，找到灰度值有几类，这样其实就是分割网络的输出有几类。

如下，可以看到总共有5个灰度值，也就代表了这个数据集是五分割的任务，0代表背景，也算作分割之一

需要注意的是，网络的输出是需要呈0 1 2 这种自然数，因为5分割的输出是5个特征图，而特征图的索引就是0 1 2 3 4，含义是每个特征图负责预测某个灰度值。

例如猫、狗、猪，三个分类任务，最后输出的张量必须是3，在3中找出最大概率的那个索引就是对应猫、狗、猪的某一类。

而网络是不知道猫、狗、猪是什么玩意，只知道0 1 2 ，我们人为规定0是猫、2是猪。

这里dataset的实现如下：

2.2 FCN网络的实现

torchvision给了我们两个backbone，resnet50和resnet101，这里我们全部实现。

其中weights参数是是否导入官方的预训练权重

2.3 数据预处理

预处理是黑匣子，对于分割这种任务，知道预处理后的图像是什么样子很有必要，这里也实现一下

其中控制台会输出这样，这样是正常的，可以看到mask的灰度值被映射到了0 1 2 3 4中

需要注意的是，如果出现了255是正常的，因为这里使用了多尺度的随机缩放，255负责填充，在train的时候，代码会自动忽略255的部分

不过有的时候出现255，上面的图像可能会出现异常。

个人猜测，plt会自动将灰度图像调色，这样哪怕mask灰度靠的很近也会很明显的展示。要是出现255的话，调色可能会冲突？