GAN.py

原代码地址:github.com/zqhang/MTGFLOW

目录

[def ConvEncoder()](#def ConvEncoder())

[def ConvDecoder()](#def ConvDecoder())

[class CNNAE(torch.nn.Module):](#class CNNAE(torch.nn.Module):)

[class R_Net(torch.nn.Module):](#class R_Net(torch.nn.Module):)

[class D_Net(torch.nn.Module):](#class D_Net(torch.nn.Module):)

[def R_Loss()](#def R_Loss())

[def D_Loss()](#def D_Loss())

[def R_WLoss()](#def R_WLoss())

[def D_WLoss()](#def D_WLoss())

[def train_model()](#def train_model())

[def train_single_epoch()](#def train_single_epoch())

[def validate_single_epoch()](#def validate_single_epoch())

[def test_single_epoch()](#def test_single_epoch())


def ConvEncoder ()

这个函数定义了一个卷积编码器,用于将输入数据进行特征提取。

python 复制代码
def ConvEncoder(activation=nn.LeakyReLU, in_channels:int=3, n_c:int=64, k_size:int=5):
    """
    定义卷积编码器模型,将输入数据进行卷积和批量归一化处理。
    
    参数:
        activation: 激活函数,默认为 LeakyReLU。
        in_channels: 输入数据的通道数,默认为 3(通常是 RGB 图像的通道数)。
        n_c: 卷积核的数量,也是输出的通道数,默认为 64。
        k_size: 卷积核的大小,默认为 5。
        
    返回:
        enc: 卷积编码器模型。
    """
    # 创建一个顺序模型(Sequential Model),按顺序添加层
    enc = nn.Sequential(
        # 第一个卷积层:输入通道数为 in_channels,输出通道数为 n_c,卷积核大小为 k_size,
        # 步幅为 2,填充为 2,使用激活函数 activation
        nn.Conv1d(in_channels, n_c, k_size, stride=2, padding=2),
        # 批量归一化层,处理卷积层的输出
        nn.BatchNorm1d(n_c),
        # 激活函数
        activation(),
        
        # 第二个卷积层:输入通道数为 n_c,输出通道数为 n_c*2,卷积核大小为 k_size,
        # 步幅为 2,填充为 2,使用激活函数 activation
        nn.Conv1d(n_c, n_c*2, k_size, stride=2, padding=2),
        # 批量归一化层,处理卷积层的输出
        nn.BatchNorm1d(n_c*2),
        # 激活函数
        activation(),
        
        # 第三个卷积层:输入通道数为 n_c*2,输出通道数为 n_c*4,卷积核大小为 k_size,
        # 步幅为 2,填充为 2,使用激活函数 activation
        nn.Conv1d(n_c*2, n_c*4, k_size, stride=2, padding=2),
        # 批量归一化层,处理卷积层的输出
        nn.BatchNorm1d(n_c*4),
        # 激活函数
        activation()
    )
    # 返回卷积编码器模型
    return enc

def ConvDecoder ()

创建一个包含卷积转置层的序列模型,用于将低维特征映射回原始输入图像的高维空间。在生成对抗网络(GAN)等模型中,该函数通常用作生成器网络的一部分,负责将潜在空间(随机噪声或其他低维表示)映射为逼真的图像。卷积转置层与普通卷积层相反,它将输入扩大(上采样)而不是缩小(下采样),从而实现从低维到高维的映射。函数返回创建的卷积转置层模型。

python 复制代码
def ConvDecoder(activation=nn.LeakyReLU, in_channels:int=3, n_c:int=64, k_size:int=5):
    # activation:激活函数,默认为 LeakyReLU
    # in_channels:输入图像的通道数,默认为3(通常是RGB图像)
    # n_c:卷积核的通道数,默认为64
    # k_size:卷积核的大小,默认为5

    # 定义一个包含卷积转置层的序列模型
    decoder = nn.Sequential(
        # 第一个卷积转置层,将输入通道数扩大4倍,然后输出通道数减半
        nn.ConvTranspose1d(n_c*4, n_c*2, k_size, stride=2, padding=2, output_padding=0),
        torch.nn.BatchNorm1d(n_c*2),  # 批归一化层,对输出进行归一化
        activation(),  # 激活函数,将输出进行非线性变换
        # 第二个卷积转置层,将输入通道数减半,然后输出通道数减半
        torch.nn.ConvTranspose1d(n_c*2, n_c, k_size, stride=2, padding=2, output_padding=1),
        torch.nn.BatchNorm1d(n_c),  # 批归一化层,对输出进行归一化
        activation(),  # 激活函数,将输出进行非线性变换
        # 第三个卷积转置层,将输入通道数减半,然后输出通道数与输入图像的通道数相同
        torch.nn.ConvTranspose1d(n_c, in_channels, k_size, stride=2, padding=2, output_padding=1)
    )
    return decoder

class CNNAE(torch.nn.Module):

这段代码定义了一个基于卷积神经网络的自动编码器模型(CNNAE)。自动编码器是一种无监督学习模型,它可以学习输入数据的紧凑表示(编码),然后再将这个紧凑表示解码为原始输入数据的重构。在这个模型中,编码器和解码器都是使用卷积神经网络实现的。模型的初始化方法(__init__)中设置了输入图像的通道数、卷积核数量和卷积核大小,并创建了编码器和解码器。前向传播方法(forward)定义了输入数据的处理过程,首先通过编码器获得特征表示,然后通过解码器将特征表示解码为重构的图像。这种结构使得模型可以学习到输入数据的有效表示,用于图像的压缩和重构等任务。

python 复制代码
class CNNAE(torch.nn.Module):
    """自动编码器模型,使用卷积神经网络(CNN)实现"""

    def __init__(self, in_channels:int = 3, n_channels:int = 16, kernel_size:int = 5):
        # 初始化方法,定义了模型的结构和参数
        super(CNNAE, self).__init__()

        # 设置输入图像的通道数、卷积核数量、卷积核大小
        self.in_channels = in_channels
        self.n_c = n_channels
        self.k_size = kernel_size

        # 创建编码器(使用ConvEncoder类),指定激活函数和参数
        activation = torch.nn.LeakyReLU
        self.encoder = ConvEncoder(activation, in_channels, n_channels, kernel_size)

        # 创建解码器(使用ConvDecoder类),指定激活函数和参数
        self.decoder = ConvDecoder(activation, in_channels, n_channels, kernel_size)

    def forward(self, x:torch.Tensor):
        # 前向传播方法,定义了输入数据的处理过程
        # 输入x是一个张量(Tensor),代表输入图像

        # 使用编码器对输入图像进行编码,得到特征表示z
        z = self.encoder.forward(x)

        # 使用解码器对特征表示进行解码,得到重构的图像x_out
        x_out = self.decoder.forward(z)

        # 返回重构的图像x_out
        return x_out

class R_Net(torch.nn.Module):

作用: 这段代码定义了一个名为R_Net的PyTorch模型类,表示一个带有噪音的卷积自编码器。该模型包括一个Encoder和一个Decoder,Encoder用于将输入数据编码为隐藏表示,Decoder用于将隐藏表示解码为重构输出。在前向传播过程中,可以选择是否在输入中添加噪音。该模型的主要作用是学习输入数据的压缩表示,并尽可能地恢复出原始输入数据,同时能够处理带有噪音的输入。

python 复制代码
class R_Net(torch.nn.Module):
    # 定义一个名为R_Net的PyTorch模型类,继承自torch.nn.Module基类

    def __init__(self, activation=torch.nn.LeakyReLU, in_channels:int=3, n_channels:int=16,
                 kernel_size:int=5, std:float=0.2):
        # 初始化方法,用于定义模型的结构和参数
        # 参数说明:
        # activation: 激活函数,默认为LeakyReLU
        # in_channels: 输入图像的通道数,默认为3(RGB图像)
        # n_channels: 卷积层的通道数,表示卷积核的数量,默认为16
        # kernel_size: 卷积核的大小,默认为5
        # std: 添加噪音时使用的标准差,默认为0.2

        super(R_Net, self).__init__()
        # 调用父类的构造函数,必须在子类构造函数的开始处调用

        self.activation = activation
        # 将传入的激活函数赋值给类属性self.activation

        self.in_channels = in_channels
        self.n_c = n_channels
        self.k_size = kernel_size
        self.std = std
        # 将传入的参数赋值给相应的类属性

        self.Encoder = ConvEncoder(activation, in_channels, n_channels, kernel_size)
        # 创建一个卷积编码器(使用给定的激活函数和参数)

        self.Decoder = ConvDecoder(activation, in_channels, n_channels, kernel_size)
        # 创建一个卷积解码器(使用给定的激活函数和参数)

    def forward(self, x:torch.Tensor, noise:bool=True):
        # 定义前向传播方法,定义模型的计算过程
        # 参数说明:
        # x: 输入的张量,通常是图像数据,类型为torch.Tensor
        # noise: 是否在输入中添加噪音,默认为True

        x_hat = self.add_noise(x) if noise else x
        # 如果noise为True,则在输入中添加噪音,否则不添加
        # 添加噪音的操作由self.add_noise函数完成

        z = self.Encoder.forward(x_hat)
        # 将带有噪音的输入x_hat通过Encoder模块进行编码,得到隐藏表示z

        x_out = self.Decoder.forward(z)
        # 将隐藏表示z通过Decoder模块进行解码,得到重构的输出x_out

        return x_out
        # 返回重构的输出

    def add_noise(self, x):
        # 定义一个函数,用于在输入中添加噪音
        # 参数说明:
        # x: 输入的张量,通常是图像数据,类型为torch.Tensor

        noise = torch.randn_like(x) * self.std
        # 生成与输入x相同大小的随机噪音,乘以self.std得到具有指定标准差的噪音

        x_hat = x + noise
        # 将噪音添加到输入x上,得到带有噪音的输入x_hat

        return x_hat
        # 返回带有噪音的输入x_hat

class D_Net(torch.nn.Module):

这段代码定义了一个名为D_Net的类,表示一个卷积神经网络的判别器模型。该模型接收输入图像,并输出一个单一的值,用于表示输入图像是真实样本还是生成样本。类中的forward方法定义了模型的前向传播逻辑,将输入图像通过卷积层和全连接层进行处理,得到最终的判别结果。_compute_out_dim方法用于计算卷积层输出的特征维度,以便为全连接层指定输入维度。

python 复制代码
class D_Net(torch.nn.Module):
    def __init__(self, in_resolution:int, activation=torch.nn.LeakyReLU, in_channels:int=3, n_channels:int=16, kernel_size:int=5):
        # 初始化D_Net类,定义判别器的结构
        super(D_Net, self).__init__()
        
        # 设置激活函数和输入分辨率、通道数、卷积核大小
        self.activation = activation
        self.in_resolution = in_resolution
        self.in_channels = in_channels
        self.n_c = n_channels
        self.k_size = kernel_size

        # 创建一个卷积编码器(CNN Encoder),使用给定的激活函数和参数
        self.cnn = ConvEncoder(activation, in_channels, n_channels, kernel_size)

        # 计算D网络卷积部分输出的维度
        self.out_dim = self._compute_out_dim()

        # 创建一个全连接层,将卷积部分的输出映射到一个单一的输出值(用于二元分类)
        self.fc = torch.nn.Linear(self.out_dim, 1)
        
    def _compute_out_dim(self):
        # 计算卷积部分的输出维度,用于全连接层的输入维度
        test_x = torch.Tensor(1, self.in_channels, self.in_resolution)
        
        # 冻结卷积层的参数,防止在计算过程中被修改
        for p in self.cnn.parameters():
            p.requires_grad = False
        
        # 通过卷积部分得到输出,然后计算输出的维度
        test_x = self.cnn(test_x)
        out_dim = torch.prod(torch.tensor(test_x.shape[1:])).item()
        
        # 解冻卷积层的参数,以便在训练中更新它们
        for p in self.cnn.parameters():
            p.requires_grad = True

        return out_dim

    def forward(self, x:torch.Tensor):
        # 前向传播函数,对输入图像进行判别
        # 使用卷积层处理输入图像
        x = self.cnn(x)
        # 将卷积层输出的特征图展平成一维向量
        x = torch.flatten(x, start_dim=1)
        # 通过全连接层得到最终的判别结果
        out = self.fc(x)
        return out

def R_Loss()

python 复制代码
def R_Loss(d_net: torch.nn.Module, x_real: torch.Tensor, x_fake: torch.Tensor, lambd: float) -> dict:
    # d_net 是判别器模型,用于判别生成样本的真实性。
    # x_real 是真实样本的张量。
    # x_fake 是生成样本的张量。
    # lambd 是用于权衡重构损失和生成损失的权重参数。

    # pred 是生成样本经过判别器的输出,表示生成样本被判别为真实样本的概率。
    # y 是与pred相同大小的张量,其所有元素都是1,用于计算生成损失。
    pred = d_net(x_fake)
    y = torch.ones_like(pred)
    #rec_loss 是重构损失,使用均方误差(MSE)衡量生成样本x_fake与真实样本x_real之间的差异,即生成样本与真实样本的相似度。
    rec_loss = F.mse_loss(x_fake, x_real)
    # gen_loss 是生成损失,使用二元交叉熵(Binary Cross Entropy)损失函数计算生成样本被判别为真实样本的损失,即判别器预测与实际标签的差异。
    gen_loss = F.binary_cross_entropy_with_logits(pred, y) # generator loss
    # L_r 是最终的损失函数,它由生成损失和重构损失以及二者的权重参数lambd加权组成。
    L_r = gen_loss + lambd * rec_loss
    # 函数返回一个字典,包含了重构损失(rec_loss)、生成损失(gen_loss)和最终的损失(L_r)。
    # 这些损失值用于监控和优化生成模型的性能。通常,生成模型的目标是最小化生成损失,同时保持生成样本与真实样本的相似性,即最小化重构损失。
    return {'rec_loss' : rec_loss, 'gen_loss' : gen_loss, 'L_r' : L_r}

def D_Loss()

这段代码定义了一个函数D_Loss,它计算了给定判别器(d_net)对真实样本(x_real)和生成样本(x_fake)的损失。函数首先使用判别器对真实样本和生成样本进行预测,得到预测结果。然后,为真实样本和生成样本分别创建标签(1表示真实样本,0表示生成样本)。接着,使用二元交叉熵损失函数(F.binary_cross_entropy_with_logits)分别计算真实样本和生成样本的损失(real_lossfake_loss)。最后,将这两个损失相加,得到最终的判别器损失。该函数用于训练生成对抗网络(GAN)中的判别器,目的是使判别器能够正确区分真实样本和生成样本。

python 复制代码
def D_Loss(d_net: torch.nn.Module, x_real: torch.Tensor, x_fake: torch.Tensor) -> torch.Tensor:
    # 输入参数:
    # d_net: 判别器模型
    # x_real: 真实样本
    # x_fake: 生成样本
    
    # 利用判别器对真实样本进行预测,得到预测结果
    pred_real = d_net(x_real)
    # 利用判别器对生成样本进行预测(使用detach()来阻止梯度回传),得到预测结果
    pred_fake = d_net(x_fake.detach())
    
    # 为真实样本和生成样本创建标签,1表示真实样本,0表示生成样本
    y_real = torch.ones_like(pred_real)
    y_fake = torch.zeros_like(pred_fake)

    # 使用二元交叉熵损失函数计算真实样本和生成样本的损失
    # real_loss表示真实样本的损失,fake_loss表示生成样本的损失
    real_loss = F.binary_cross_entropy_with_logits(pred_real, y_real)
    fake_loss = F.binary_cross_entropy_with_logits(pred_fake, y_fake)

    # 返回真实样本和生成样本损失的总和作为最终的判别器损失
    return real_loss + fake_loss

def R_WLoss()

这段代码定义了一个函数R_WLoss,它计算了生成对抗网络(GAN)中的损失。函数使用给定的判别器(d_net)对生成样本(x_fake)进行预测,并通过 sigmoid 激活函数将预测结果映射到 [0, 1] 范围内。然后,函数计算了两个损失项:重建损失(rec_loss,使用均方误差)和生成损失(gen_loss,Wasserstein G loss)。最后,函数计算了总的损失(L_r),其中重建损失被乘以权重 lambd。函数返回一个包含损失信息的字典,其中包括重建损失、生成损失和总损失。这些损失用于优化生成器网络。

python 复制代码
def R_WLoss(d_net: torch.nn.Module, x_real: torch.Tensor, x_fake: torch.Tensor, lambd: float) -> dict:
    # 输入参数:
    # d_net: 判别器模型
    # x_real: 真实样本
    # x_fake: 生成样本
    # lambd: 重建损失的权重
    
    # 使用判别器对生成样本进行预测,得到预测结果,并经过 sigmoid 激活函数
    pred = torch.sigmoid(d_net(x_fake))

    # 计算重建损失(均方误差)
    rec_loss = F.mse_loss(x_fake, x_real)
    # 计算生成损失(Wasserstein G loss: - E[ D(G(x)) ])
    gen_loss = -torch.mean(pred)

    # 计算总损失(L_r = 生成损失 + 重建损失 * 权重 lambd)
    L_r = gen_loss + lambd * rec_loss

    # 返回损失信息的字典,包括重建损失、生成损失和总损失
    return {'rec_loss': rec_loss, 'gen_loss': gen_loss, 'L_r': L_r}

def D_WLoss()

这段代码定义了一个函数D_WLoss,它计算了生成对抗网络(GAN)中鉴别器的损失。函数使用给定的判别器(d_net)对真实样本(x_real)和生成样本(x_fake)进行预测,并通过 sigmoid 激活函数将预测结果映射到 [0, 1] 范围内。然后,函数计算了两个损失项:真实样本的损失(-E[D(x_real)])和生成样本的损失(E[D(x_fake)])。这两个损失项相加后得到鉴别器的总损失,这个损失用于优化鉴别器网络。

python 复制代码
def D_WLoss(d_net: torch.nn.Module, x_real: torch.Tensor, x_fake: torch.Tensor) -> torch.Tensor:
    # 输入参数:
    # d_net: 判别器模型
    # x_real: 真实样本
    # x_fake: 生成样本
    
    # 使用判别器对真实样本和生成样本进行预测,得到预测结果,并通过 sigmoid 激活函数
    pred_real = torch.sigmoid(d_net(x_real))
    pred_fake = torch.sigmoid(d_net(x_fake.detach()))
    
    # 计算鉴别器的损失(Wasserstein D loss: -E[D(x_real)] + E[D(x_fake)])
    dis_loss = -torch.mean(pred_real) + torch.mean(pred_fake)

    # 返回鉴别器损失
    return dis_loss

def train_model()

这段代码定义了一个函数train_model,用于训练生成对抗网络(GAN)的生成器和判别器模型。函数接受多个参数,包括生成器模型(r_net)、判别器模型(d_net)、训练数据加载器(train_loader)、测试数据加载器(test_loader)等等。函数中包含了训练循环,每个epoch会进行一次训练和测试,并根据需要保存模型。

python 复制代码
def train_model(args, r_net: torch.nn.Module,
                d_net: torch.nn.Module,
                train_loader: torch.utils.data.DataLoader,
                test_loader: torch.utils.data.DataLoader,
                r_loss = R_Loss,
                d_loss = D_Loss,
                lr_scheduler = None,
                optimizer_class = torch.optim.Adam,
                optim_r_params: dict = {},
                optim_d_params: dict = {},
                learning_rate: float = 0.001,
                scheduler_r_params: dict = {},
                scheduler_d_params: dict = {},
                batch_size: int = 1024,
                max_epochs: int = 40,
                epoch_step: int = 1,
                save_step: int = 5,
                lambd: float = 0.2,
                device: torch.device = torch.device('cuda'),
                save_path: str = ".") -> tuple:
    # 参数说明:
    # args: 其他训练参数的配置
    # r_net: 生成器模型
    # d_net: 判别器模型
    # train_loader: 训练数据的数据加载器
    # test_loader: 测试数据的数据加载器
    # r_loss: 生成器的损失函数,默认为R_Loss
    # d_loss: 判别器的损失函数,默认为D_Loss
    # lr_scheduler: 学习率调度器,默认为None
    # optimizer_class: 优化器类型,默认为torch.optim.Adam
    # optim_r_params: 生成器优化器的参数,默认为空字典
    # optim_d_params: 判别器优化器的参数,默认为空字典
    # learning_rate: 初始学习率,默认为0.001
    # scheduler_r_params: 生成器学习率调度器的参数,默认为空字典
    # scheduler_d_params: 判别器学习率调度器的参数,默认为空字典
    # batch_size: 批大小,默认为1024
    # max_epochs: 最大训练轮数,默认为40
    # epoch_step: 每隔多少轮打印训练信息,默认为1
    # save_step: 每隔多少轮保存模型,默认为5
    # lambd: R_Loss中的lambda参数,默认为0.2
    # device: 训练设备,默认为'cuda'
    # save_path: 模型保存路径,默认为当前目录
    
    # 创建生成器和判别器的优化器
    optim_r = optimizer_class(r_net.parameters(), lr=learning_rate, **optim_r_params)
    optim_d = optimizer_class(d_net.parameters(), lr=learning_rate, **optim_d_params)

    # 创建学习率调度器
    if lr_scheduler:
        scheduler_r = lr_scheduler(optim_r, **scheduler_r_params)
        scheduler_d = lr_scheduler(optim_d, **scheduler_d_params)

    logger = log()  # 日志记录器

    # 开始训练循环
    for epoch in range(max_epochs):
        start = timer()  # 记录每轮开始时间
        # 训练一个epoch并获取训练指标
        train_metrics = train_single_epoch(r_net, d_net, optim_r, optim_d, r_loss, d_loss, train_loader, lambd, device)
        # 测试模型并获取测试指标
        gt, pre = test_metrics = test_single_epoch(r_net, d_net, r_loss, d_loss, test_loader, device)
        # 记录测试结果
        # logger.print_result(gt, pre, (r_net, d_net), args.seed, args)
        time = timer() - start  # 记录每轮训练时间

        # 每隔一定轮数打印训练信息
        if epoch % epoch_step == 0:
            print(f'Epoch {epoch}:')
            # print('Train Metrics:', train_metrics)
            # print('Test Metrics:', test_metrics)
            # print(f'TIME: {time:.2f} s')

        # 学习率调度器进行一步学习率更新
        if lr_scheduler:
            scheduler_r.step()
            scheduler_d.step()

        # 每隔一定轮数保存模型
        # if epoch % save_step == 0:
        #     torch.save(r_net.state_dict(), os.path.join(save_path, "r_net_{}.pt".format(epoch)))
        #     torch.save(d_net.state_dict(), os.path.join(save_path, "d_net_{}.pt".format(epoch)))
        #     print(f'Saving model on epoch {epoch}')

    # 返回训练好的生成器和判别器模型
    return (r_net, d_net)

def train_single_epoch()

这段代码定义了一个函数`train_single_epoch`,用于训练一个epoch。在每个batch的训练中,首先将真实数据传入判别器,计算判别器损失,并更新判别器的参数。然后,将真实数据传入生成器生成假数据,计算生成器损失(包括重构损失和对抗损失),并更新生成器的参数。最后,将每个batch的损失累加,并计算每个样本的平均损失。函数返回一个包含平均损失的字典。

python 复制代码
def train_single_epoch(r_net, d_net, optim_r, optim_d, r_loss, d_loss, train_loader, lambd, device) -> dict:
    # 参数说明:
    # r_net: 生成器模型
    # d_net: 判别器模型
    # optim_r: 生成器的优化器
    # optim_d: 判别器的优化器
    # r_loss: 生成器的损失函数
    # d_loss: 判别器的损失函数
    # train_loader: 训练数据的数据加载器
    # lambd: R_Loss中的lambda参数
    # device: 训练设备
    
    r_net.train()  # 设置生成器为训练模式
    d_net.train()  # 设置判别器为训练模式

    train_metrics = {'rec_loss': 0, 'gen_loss': 0, 'dis_loss': 0}  # 初始化训练指标

    for data, _, idx in train_loader:
        x = data.to(device)  # 将数据移动到指定设备上
        x = torch.transpose(x, dim0=2, dim1=3)  # 调整输入数据的维度
        x_real = x.reshape(x.shape[0], x.shape[1] * x.shape[2], x.shape[3])  # 调整输入数据的形状

        x_fake = r_net(x_real)  # 通过生成器生成假数据
        d_net.zero_grad()  # 判别器梯度清零

        dis_loss = d_loss(d_net, x_real, x_fake)  # 计算判别器损失

        dis_loss.backward()  # 反向传播并更新判别器参数
        optim_d.step()  # 判别器优化器更新

        r_net.zero_grad()  # 生成器梯度清零

        r_metrics = r_loss(d_net, x_real, x_fake, lambd)  # 计算生成器损失,包含重构损失和对抗损失

        r_metrics['L_r'].backward()  # 反向传播并更新生成器参数
        optim_r.step()  # 生成器优化器更新

        # 累加每个batch的损失
        train_metrics['rec_loss'] += r_metrics['rec_loss']
        train_metrics['gen_loss'] += r_metrics['gen_loss']
        train_metrics['dis_loss'] += dis_loss

    # 计算每个样本的平均损失
    train_metrics['rec_loss'] = train_metrics['rec_loss'].item() / (len(train_loader.dataset) / train_loader.batch_size)
    train_metrics['gen_loss'] = train_metrics['gen_loss'].item() / (len(train_loader.dataset) / train_loader.batch_size)
    train_metrics['dis_loss'] = train_metrics['dis_loss'].item() / (len(train_loader.dataset) / train_loader.batch_size)

    return train_metrics  # 返回训练指标字典

def validate_single_epoch()

这段代码定义了一个函数validate_single_epoch,用于在验证集上评估模型。与训练过程类似,首先将真实数据传入判别器,计算判别器损失。然后,将真实数据传入生成器生成假数据,计算生成器损失。最后,将每个batch的损失累加,并计算每个样本的平均损失。函数返回一个包含平均损失的字典。

python 复制代码
def validate_single_epoch(r_net, d_net, r_loss, d_loss, valid_loader, device) -> dict:
    # 参数说明:
    # r_net: 生成器模型
    # d_net: 判别器模型
    # r_loss: 生成器的损失函数
    # d_loss: 判别器的损失函数
    # valid_loader: 验证数据的数据加载器
    # device: 训练设备

    r_net.eval()  # 设置生成器为评估模式
    d_net.eval()  # 设置判别器为评估模式

    valid_metrics = {'rec_loss': 0, 'gen_loss': 0, 'dis_loss': 0}  # 初始化验证指标

    with torch.no_grad():
        for data, _, idx in valid_loader:
            x = data.to(device)  # 将数据移动到指定设备上
            x = torch.transpose(x, dim0=2, dim1=3)  # 调整输入数据的维度
            x_real = x.reshape(x.shape[0], x.shape[1] * x.shape[2], x.shape[3])  # 调整输入数据的形状

            x_fake = r_net(x_real)  # 通过生成器生成假数据

            dis_loss = d_loss(d_net, x_real, x_fake)  # 计算判别器损失

            r_metrics = r_loss(d_net, x_real, x_fake, 0)  # 计算生成器损失,lambda参数为0表示不使用重构损失

            # 累加每个batch的损失
            valid_metrics['rec_loss'] += r_metrics['rec_loss']
            valid_metrics['gen_loss'] += r_metrics['gen_loss']
            valid_metrics['dis_loss'] += dis_loss

        # 计算每个样本的平均损失
        valid_metrics['rec_loss'] = valid_metrics['rec_loss'].item() / (len(valid_loader.dataset) / valid_loader.batch_size)
        valid_metrics['gen_loss'] = valid_metrics['gen_loss'].item() / (len(valid_loader.dataset) / valid_loader.batch_size)
        valid_metrics['dis_loss'] = valid_metrics['dis_loss'].item() / (len(valid_loader.dataset) / valid_loader.batch_size)

    return valid_metrics  # 返回验证指标字典

def test_single_epoch()

这段代码定义了一个函数test_single_epoch,用于在测试集上评估模型。与验证过程类似,首先将真实数据传入判别器,计算判别器损失,并将损失值添加到损失列表中。然后,将损失列表的元素合并为一个Tensor,并将NaN值替换为0。接着,使用roc_auc_score函数计算ROC AUC得分,并将结果打印出来。函数返回真实标签和负的损失值,用于ROC AUC计算。

python 复制代码
def test_single_epoch(r_net, d_net, r_loss, d_loss, test_loader, device) -> dict:
    # 参数说明:
    # r_net: 生成器模型
    # d_net: 判别器模型
    # r_loss: 生成器的损失函数
    # d_loss: 判别器的损失函数
    # test_loader: 测试数据的数据加载器
    # device: 训练设备

    r_net.eval()  # 设置生成器为评估模式
    d_net.eval()  # 设置判别器为评估模式

    valid_metrics = {'rec_loss': 0, 'gen_loss': 0, 'dis_loss': 0}  # 初始化验证指标
    loss = []  # 初始化损失列表

    with torch.no_grad():
        for data, _, idx in test_loader:
            x = data.to(device)  # 将数据移动到指定设备上
            x = torch.transpose(x, dim0=2, dim1=3)  # 调整输入数据的维度
            x_real = x.reshape(x.shape[0], x.shape[1] * x.shape[2], x.shape[3])  # 调整输入数据的形状

            dis_loss = d_net(x_real).squeeze().cpu()  # 计算判别器损失,并将结果移回CPU

            loss.append(dis_loss)  # 将损失添加到损失列表中

        loss = torch.cat(loss)  # 将损失列表合并为一个Tensor
        loss = np.nan_to_num(loss)  # 将NaN值替换为0
        auc_score = roc_auc_score(np.asarray(test_loader.dataset.label, dtype=int), -loss)  # 计算ROC AUC得分

        print('roc_test', auc_score)  # 打印测试集的ROC AUC得分
        return np.asarray(test_loader.dataset.label, dtype=int), -loss  # 返回真实标签和负的损失值(用于ROC AUC计算)
相关推荐
学术头条1 小时前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客1 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
Ven%1 小时前
如何在防火墙上指定ip访问服务器上任何端口呢
linux·服务器·网络·深度学习·tcp/ip
IT猿手2 小时前
最新高性能多目标优化算法:多目标麋鹿优化算法(MOEHO)求解TP1-TP10及工程应用---盘式制动器设计,提供完整MATLAB代码
开发语言·深度学习·算法·机器学习·matlab·多目标算法
强哥之神2 小时前
Nexa AI发布OmniAudio-2.6B:一款快速的音频语言模型,专为边缘部署设计
人工智能·深度学习·机器学习·语言模型·自然语言处理·音视频·openai
18号房客2 小时前
一个简单的深度学习模型例程,使用Keras(基于TensorFlow)构建一个卷积神经网络(CNN)来分类MNIST手写数字数据集。
人工智能·深度学习·机器学习·生成对抗网络·语言模型·自然语言处理·tensorflow
神秘的土鸡2 小时前
神经网络图像隐写术:用AI隐藏信息的艺术
人工智能·深度学习·神经网络
数据分析能量站2 小时前
神经网络-LeNet
人工智能·深度学习·神经网络·机器学习
Jaly_W2 小时前
用于航空发动机故障诊断的深度分层排序网络
人工智能·深度学习·故障诊断·航空发动机
FL16238631293 小时前
钢材缺陷识别分割数据集labelme格式693张4类别
深度学习