DP-GAN损失

在前面我们看了生成器和判别器的组成。

生成器损失公式:

首先将fake image 和真实的 image输入到判别器中:

接着看第一个损失:参数分别为fake image经过判别器的输出mask,和真实的label 进行损失计算。对应于:

其中loss对应于:

python 复制代码
class losses_computer():
    def __init__(self, opt):
        self.opt = opt
        if not opt.no_labelmix:
            self.labelmix_function = torch.nn.MSELoss()

    def loss(self, input, label, for_real):#true
        #--- balancing classes ---
        weight_map = get_class_balancing(self.opt, input, label)
        #--- n+1 loss ---
        target = get_n1_target(self.opt, input, label, for_real)
        loss = F.cross_entropy(input, target, reduction='none')
        if for_real:
            loss = torch.mean(loss * weight_map[:, 0, :, :])
        else:
            loss = torch.mean(loss)
        return loss

1:首先平衡类别,input大小为(1,36,256,512),label大小为(1,35,256,512).

首先将label每个通道所有的值相加,最后只剩下C个值。

接着将class_occurence第一个值替换为0(在标签中第一个值为空).然后将列表值和0进行比较,统计为True的个数,就是总的类别。

然后求总的类别权重,一张图有24个类别,总的标签图有35各类别,缺失的类别为inf。

根据argmax获得label的通道索引,输出通道为一的mask图。

根据类别找对应的权重值。

接着标签和label输入到:

首先得到一个和input相同大小的全1矩阵。这个矩阵是放在cuda上,用1填充,不需要更新,和input相同维度。

接着取label的索引,将全1矩阵target压缩通道维度和numclass相乘,这样所有的值都是35,在和label的类别值相加。因为相加之后的值肯定大于35,即clamp将小于34的值替换为34.(感觉clamp并没有起作用),减去35加1,相当于将label类别值全部加1了。

最后将辨别器的decoder输出和真实的label 进行交叉熵计算。

将loss和类别权重相乘,再求均值得到最终的损失。

接着是第二个损失:生成器希望生成的结果可以骗过判别器,fake产生的图片要尽可能的真实。

score是判别器encoder部分的两个输出。

在GANloss中:

在loss中:

生成器是不完全执行patch_loss,为了使损失更小,则-1+D(x)就要趋近于0,因为D最后是输出一个通道为1的值,即经过sigmoid每个像素输出值在[0,1]之内,为了使-1+D(x)最小,则输出就要尽可能为1,即输出要尽可能正确。

得到的两个GANloss相加求均值,再和之前的对抗损失相加。

第三个是特征匹配损失:输入是real image和fake image经过decoder的五个中间变量输出。

通过循环计算每一个输出对之间的MSE损失。

将生成的结果和前面两种损失相加。

最后输出:总损失,[对抗损失,None]。

接着损失取均值,然后反向传播。

然后说判别器的损失:

按照公式:GAN loss需要计算fake image 和 real image产生的中间变量,然后相加。而生成器不用计算E(z,l)。

在代码中通过控制target的True和False来计算两个loss。

损失包含:

1:fake image经过判别器得到的mask和真实的label计算对抗损失。

2:real image经过判别器得到的mask和真实的label计算对抗损失。

3:两个GAN loss。

4:label mix

首先获得label上的类别值,然后遍历类别值,将mask中的类别随机替换为0或者1,然后和真实的image相乘,对target_map取反后和fake_image相乘最后相加。最终输出混合的image和新的target_map。

混合的image输入判别器中后计算labelmix损失:

四个参数:进过[0,1]替换后的mask,mix_image经过判别器的输出,fake_image经过判别器的输出和real_image经过判别器的输出。

生成的label_mix loss和原始的三个loss相加。

这样就计算完了辨别器损失。

相关推荐
人工智能研究所2 分钟前
视频与音频碰撞,谷歌 Veo 3.1,生成“有声电影”,人物对话超震撼
人工智能·文生图·谷歌·文生视频·veo3.1
DisonTangor8 分钟前
PaddleOCR-VL: 通过0.9B超紧凑视觉语言模型增强多语言文档解析
人工智能·计算机视觉·语言模型·自然语言处理·开源·aigc
skywalk81639 分钟前
在Ubuntu Linux安装brew 使用brew安装llama.cpp 运行文心Ernie大模型
人工智能·ubuntu·llama·ernie·brew·1024程序员节
golang学习记14 分钟前
Vibe Coding不香了,试试深信服的CoStrict 严肃编程模式
人工智能
蒙奇·D·路飞-18 分钟前
Grok、Claude、ChatGPT、Gemini模型适用场景比较
人工智能·chatgpt
腾视科技22 分钟前
安全驾驶 智在掌控|腾视科技ES06终端,为车辆运营赋能
大数据·人工智能·科技·安全·大模型
飞哥数智坊28 分钟前
Cursor + CloudBase,两周闲暇时间做出我的“AI 碎片助理”
人工智能·ai编程
库库8391 小时前
Spring AI 知识点总结
java·人工智能·spring
AndrewHZ1 小时前
【图像处理基石】通过立体视觉重建建筑高度:原理、实操与代码实现
图像处理·人工智能·计算机视觉·智慧城市·三维重建·立体视觉·1024程序员节