原代码地址:github.com/zqhang/MTGFLOW
目录
[def ConvEncoder()](#def ConvEncoder())
[def ConvDecoder()](#def ConvDecoder())
[class CNNAE(torch.nn.Module):](#class CNNAE(torch.nn.Module):)
[class R_Net(torch.nn.Module):](#class R_Net(torch.nn.Module):)
[class D_Net(torch.nn.Module):](#class D_Net(torch.nn.Module):)
[def R_Loss()](#def R_Loss())
[def D_Loss()](#def D_Loss())
[def R_WLoss()](#def R_WLoss())
[def D_WLoss()](#def D_WLoss())
[def train_model()](#def train_model())
[def train_single_epoch()](#def train_single_epoch())
[def validate_single_epoch()](#def validate_single_epoch())
[def test_single_epoch()](#def test_single_epoch())
def ConvEncoder ()
这个函数定义了一个卷积编码器,用于将输入数据进行特征提取。
python
def ConvEncoder(activation=nn.LeakyReLU, in_channels:int=3, n_c:int=64, k_size:int=5):
"""
定义卷积编码器模型,将输入数据进行卷积和批量归一化处理。
参数:
activation: 激活函数,默认为 LeakyReLU。
in_channels: 输入数据的通道数,默认为 3(通常是 RGB 图像的通道数)。
n_c: 卷积核的数量,也是输出的通道数,默认为 64。
k_size: 卷积核的大小,默认为 5。
返回:
enc: 卷积编码器模型。
"""
# 创建一个顺序模型(Sequential Model),按顺序添加层
enc = nn.Sequential(
# 第一个卷积层:输入通道数为 in_channels,输出通道数为 n_c,卷积核大小为 k_size,
# 步幅为 2,填充为 2,使用激活函数 activation
nn.Conv1d(in_channels, n_c, k_size, stride=2, padding=2),
# 批量归一化层,处理卷积层的输出
nn.BatchNorm1d(n_c),
# 激活函数
activation(),
# 第二个卷积层:输入通道数为 n_c,输出通道数为 n_c*2,卷积核大小为 k_size,
# 步幅为 2,填充为 2,使用激活函数 activation
nn.Conv1d(n_c, n_c*2, k_size, stride=2, padding=2),
# 批量归一化层,处理卷积层的输出
nn.BatchNorm1d(n_c*2),
# 激活函数
activation(),
# 第三个卷积层:输入通道数为 n_c*2,输出通道数为 n_c*4,卷积核大小为 k_size,
# 步幅为 2,填充为 2,使用激活函数 activation
nn.Conv1d(n_c*2, n_c*4, k_size, stride=2, padding=2),
# 批量归一化层,处理卷积层的输出
nn.BatchNorm1d(n_c*4),
# 激活函数
activation()
)
# 返回卷积编码器模型
return enc
def ConvDecoder ()
创建一个包含卷积转置层的序列模型,用于将低维特征映射回原始输入图像的高维空间。在生成对抗网络(GAN)等模型中,该函数通常用作生成器网络的一部分,负责将潜在空间(随机噪声或其他低维表示)映射为逼真的图像。卷积转置层与普通卷积层相反,它将输入扩大(上采样)而不是缩小(下采样),从而实现从低维到高维的映射。函数返回创建的卷积转置层模型。
python
def ConvDecoder(activation=nn.LeakyReLU, in_channels:int=3, n_c:int=64, k_size:int=5):
# activation:激活函数,默认为 LeakyReLU
# in_channels:输入图像的通道数,默认为3(通常是RGB图像)
# n_c:卷积核的通道数,默认为64
# k_size:卷积核的大小,默认为5
# 定义一个包含卷积转置层的序列模型
decoder = nn.Sequential(
# 第一个卷积转置层,将输入通道数扩大4倍,然后输出通道数减半
nn.ConvTranspose1d(n_c*4, n_c*2, k_size, stride=2, padding=2, output_padding=0),
torch.nn.BatchNorm1d(n_c*2), # 批归一化层,对输出进行归一化
activation(), # 激活函数,将输出进行非线性变换
# 第二个卷积转置层,将输入通道数减半,然后输出通道数减半
torch.nn.ConvTranspose1d(n_c*2, n_c, k_size, stride=2, padding=2, output_padding=1),
torch.nn.BatchNorm1d(n_c), # 批归一化层,对输出进行归一化
activation(), # 激活函数,将输出进行非线性变换
# 第三个卷积转置层,将输入通道数减半,然后输出通道数与输入图像的通道数相同
torch.nn.ConvTranspose1d(n_c, in_channels, k_size, stride=2, padding=2, output_padding=1)
)
return decoder
class CNNAE(torch.nn.Module):
这段代码定义了一个基于卷积神经网络的自动编码器模型(CNNAE)。自动编码器是一种无监督学习模型,它可以学习输入数据的紧凑表示(编码),然后再将这个紧凑表示解码为原始输入数据的重构。在这个模型中,编码器和解码器都是使用卷积神经网络实现的。模型的初始化方法(__init__
)中设置了输入图像的通道数、卷积核数量和卷积核大小,并创建了编码器和解码器。前向传播方法(forward
)定义了输入数据的处理过程,首先通过编码器获得特征表示,然后通过解码器将特征表示解码为重构的图像。这种结构使得模型可以学习到输入数据的有效表示,用于图像的压缩和重构等任务。
python
class CNNAE(torch.nn.Module):
"""自动编码器模型,使用卷积神经网络(CNN)实现"""
def __init__(self, in_channels:int = 3, n_channels:int = 16, kernel_size:int = 5):
# 初始化方法,定义了模型的结构和参数
super(CNNAE, self).__init__()
# 设置输入图像的通道数、卷积核数量、卷积核大小
self.in_channels = in_channels
self.n_c = n_channels
self.k_size = kernel_size
# 创建编码器(使用ConvEncoder类),指定激活函数和参数
activation = torch.nn.LeakyReLU
self.encoder = ConvEncoder(activation, in_channels, n_channels, kernel_size)
# 创建解码器(使用ConvDecoder类),指定激活函数和参数
self.decoder = ConvDecoder(activation, in_channels, n_channels, kernel_size)
def forward(self, x:torch.Tensor):
# 前向传播方法,定义了输入数据的处理过程
# 输入x是一个张量(Tensor),代表输入图像
# 使用编码器对输入图像进行编码,得到特征表示z
z = self.encoder.forward(x)
# 使用解码器对特征表示进行解码,得到重构的图像x_out
x_out = self.decoder.forward(z)
# 返回重构的图像x_out
return x_out
class R_Net(torch.nn.Module):
作用: 这段代码定义了一个名为R_Net
的PyTorch模型类,表示一个带有噪音的卷积自编码器。该模型包括一个Encoder和一个Decoder,Encoder用于将输入数据编码为隐藏表示,Decoder用于将隐藏表示解码为重构输出。在前向传播过程中,可以选择是否在输入中添加噪音。该模型的主要作用是学习输入数据的压缩表示,并尽可能地恢复出原始输入数据,同时能够处理带有噪音的输入。
python
class R_Net(torch.nn.Module):
# 定义一个名为R_Net的PyTorch模型类,继承自torch.nn.Module基类
def __init__(self, activation=torch.nn.LeakyReLU, in_channels:int=3, n_channels:int=16,
kernel_size:int=5, std:float=0.2):
# 初始化方法,用于定义模型的结构和参数
# 参数说明:
# activation: 激活函数,默认为LeakyReLU
# in_channels: 输入图像的通道数,默认为3(RGB图像)
# n_channels: 卷积层的通道数,表示卷积核的数量,默认为16
# kernel_size: 卷积核的大小,默认为5
# std: 添加噪音时使用的标准差,默认为0.2
super(R_Net, self).__init__()
# 调用父类的构造函数,必须在子类构造函数的开始处调用
self.activation = activation
# 将传入的激活函数赋值给类属性self.activation
self.in_channels = in_channels
self.n_c = n_channels
self.k_size = kernel_size
self.std = std
# 将传入的参数赋值给相应的类属性
self.Encoder = ConvEncoder(activation, in_channels, n_channels, kernel_size)
# 创建一个卷积编码器(使用给定的激活函数和参数)
self.Decoder = ConvDecoder(activation, in_channels, n_channels, kernel_size)
# 创建一个卷积解码器(使用给定的激活函数和参数)
def forward(self, x:torch.Tensor, noise:bool=True):
# 定义前向传播方法,定义模型的计算过程
# 参数说明:
# x: 输入的张量,通常是图像数据,类型为torch.Tensor
# noise: 是否在输入中添加噪音,默认为True
x_hat = self.add_noise(x) if noise else x
# 如果noise为True,则在输入中添加噪音,否则不添加
# 添加噪音的操作由self.add_noise函数完成
z = self.Encoder.forward(x_hat)
# 将带有噪音的输入x_hat通过Encoder模块进行编码,得到隐藏表示z
x_out = self.Decoder.forward(z)
# 将隐藏表示z通过Decoder模块进行解码,得到重构的输出x_out
return x_out
# 返回重构的输出
def add_noise(self, x):
# 定义一个函数,用于在输入中添加噪音
# 参数说明:
# x: 输入的张量,通常是图像数据,类型为torch.Tensor
noise = torch.randn_like(x) * self.std
# 生成与输入x相同大小的随机噪音,乘以self.std得到具有指定标准差的噪音
x_hat = x + noise
# 将噪音添加到输入x上,得到带有噪音的输入x_hat
return x_hat
# 返回带有噪音的输入x_hat
class D_Net(torch.nn.Module):
这段代码定义了一个名为D_Net
的类,表示一个卷积神经网络的判别器模型。该模型接收输入图像,并输出一个单一的值,用于表示输入图像是真实样本还是生成样本。类中的forward
方法定义了模型的前向传播逻辑,将输入图像通过卷积层和全连接层进行处理,得到最终的判别结果。_compute_out_dim
方法用于计算卷积层输出的特征维度,以便为全连接层指定输入维度。
python
class D_Net(torch.nn.Module):
def __init__(self, in_resolution:int, activation=torch.nn.LeakyReLU, in_channels:int=3, n_channels:int=16, kernel_size:int=5):
# 初始化D_Net类,定义判别器的结构
super(D_Net, self).__init__()
# 设置激活函数和输入分辨率、通道数、卷积核大小
self.activation = activation
self.in_resolution = in_resolution
self.in_channels = in_channels
self.n_c = n_channels
self.k_size = kernel_size
# 创建一个卷积编码器(CNN Encoder),使用给定的激活函数和参数
self.cnn = ConvEncoder(activation, in_channels, n_channels, kernel_size)
# 计算D网络卷积部分输出的维度
self.out_dim = self._compute_out_dim()
# 创建一个全连接层,将卷积部分的输出映射到一个单一的输出值(用于二元分类)
self.fc = torch.nn.Linear(self.out_dim, 1)
def _compute_out_dim(self):
# 计算卷积部分的输出维度,用于全连接层的输入维度
test_x = torch.Tensor(1, self.in_channels, self.in_resolution)
# 冻结卷积层的参数,防止在计算过程中被修改
for p in self.cnn.parameters():
p.requires_grad = False
# 通过卷积部分得到输出,然后计算输出的维度
test_x = self.cnn(test_x)
out_dim = torch.prod(torch.tensor(test_x.shape[1:])).item()
# 解冻卷积层的参数,以便在训练中更新它们
for p in self.cnn.parameters():
p.requires_grad = True
return out_dim
def forward(self, x:torch.Tensor):
# 前向传播函数,对输入图像进行判别
# 使用卷积层处理输入图像
x = self.cnn(x)
# 将卷积层输出的特征图展平成一维向量
x = torch.flatten(x, start_dim=1)
# 通过全连接层得到最终的判别结果
out = self.fc(x)
return out
def R_Loss()
python
def R_Loss(d_net: torch.nn.Module, x_real: torch.Tensor, x_fake: torch.Tensor, lambd: float) -> dict:
# d_net 是判别器模型,用于判别生成样本的真实性。
# x_real 是真实样本的张量。
# x_fake 是生成样本的张量。
# lambd 是用于权衡重构损失和生成损失的权重参数。
# pred 是生成样本经过判别器的输出,表示生成样本被判别为真实样本的概率。
# y 是与pred相同大小的张量,其所有元素都是1,用于计算生成损失。
pred = d_net(x_fake)
y = torch.ones_like(pred)
#rec_loss 是重构损失,使用均方误差(MSE)衡量生成样本x_fake与真实样本x_real之间的差异,即生成样本与真实样本的相似度。
rec_loss = F.mse_loss(x_fake, x_real)
# gen_loss 是生成损失,使用二元交叉熵(Binary Cross Entropy)损失函数计算生成样本被判别为真实样本的损失,即判别器预测与实际标签的差异。
gen_loss = F.binary_cross_entropy_with_logits(pred, y) # generator loss
# L_r 是最终的损失函数,它由生成损失和重构损失以及二者的权重参数lambd加权组成。
L_r = gen_loss + lambd * rec_loss
# 函数返回一个字典,包含了重构损失(rec_loss)、生成损失(gen_loss)和最终的损失(L_r)。
# 这些损失值用于监控和优化生成模型的性能。通常,生成模型的目标是最小化生成损失,同时保持生成样本与真实样本的相似性,即最小化重构损失。
return {'rec_loss' : rec_loss, 'gen_loss' : gen_loss, 'L_r' : L_r}
def D_Loss()
这段代码定义了一个函数D_Loss
,它计算了给定判别器(d_net
)对真实样本(x_real
)和生成样本(x_fake
)的损失。函数首先使用判别器对真实样本和生成样本进行预测,得到预测结果。然后,为真实样本和生成样本分别创建标签(1表示真实样本,0表示生成样本)。接着,使用二元交叉熵损失函数(F.binary_cross_entropy_with_logits
)分别计算真实样本和生成样本的损失(real_loss
和fake_loss
)。最后,将这两个损失相加,得到最终的判别器损失。该函数用于训练生成对抗网络(GAN)中的判别器,目的是使判别器能够正确区分真实样本和生成样本。
python
def D_Loss(d_net: torch.nn.Module, x_real: torch.Tensor, x_fake: torch.Tensor) -> torch.Tensor:
# 输入参数:
# d_net: 判别器模型
# x_real: 真实样本
# x_fake: 生成样本
# 利用判别器对真实样本进行预测,得到预测结果
pred_real = d_net(x_real)
# 利用判别器对生成样本进行预测(使用detach()来阻止梯度回传),得到预测结果
pred_fake = d_net(x_fake.detach())
# 为真实样本和生成样本创建标签,1表示真实样本,0表示生成样本
y_real = torch.ones_like(pred_real)
y_fake = torch.zeros_like(pred_fake)
# 使用二元交叉熵损失函数计算真实样本和生成样本的损失
# real_loss表示真实样本的损失,fake_loss表示生成样本的损失
real_loss = F.binary_cross_entropy_with_logits(pred_real, y_real)
fake_loss = F.binary_cross_entropy_with_logits(pred_fake, y_fake)
# 返回真实样本和生成样本损失的总和作为最终的判别器损失
return real_loss + fake_loss
def R_WLoss()
这段代码定义了一个函数R_WLoss
,它计算了生成对抗网络(GAN)中的损失。函数使用给定的判别器(d_net
)对生成样本(x_fake
)进行预测,并通过 sigmoid 激活函数将预测结果映射到 [0, 1] 范围内。然后,函数计算了两个损失项:重建损失(rec_loss
,使用均方误差)和生成损失(gen_loss
,Wasserstein G loss)。最后,函数计算了总的损失(L_r
),其中重建损失被乘以权重 lambd
。函数返回一个包含损失信息的字典,其中包括重建损失、生成损失和总损失。这些损失用于优化生成器网络。
python
def R_WLoss(d_net: torch.nn.Module, x_real: torch.Tensor, x_fake: torch.Tensor, lambd: float) -> dict:
# 输入参数:
# d_net: 判别器模型
# x_real: 真实样本
# x_fake: 生成样本
# lambd: 重建损失的权重
# 使用判别器对生成样本进行预测,得到预测结果,并经过 sigmoid 激活函数
pred = torch.sigmoid(d_net(x_fake))
# 计算重建损失(均方误差)
rec_loss = F.mse_loss(x_fake, x_real)
# 计算生成损失(Wasserstein G loss: - E[ D(G(x)) ])
gen_loss = -torch.mean(pred)
# 计算总损失(L_r = 生成损失 + 重建损失 * 权重 lambd)
L_r = gen_loss + lambd * rec_loss
# 返回损失信息的字典,包括重建损失、生成损失和总损失
return {'rec_loss': rec_loss, 'gen_loss': gen_loss, 'L_r': L_r}
def D_WLoss()
这段代码定义了一个函数D_WLoss
,它计算了生成对抗网络(GAN)中鉴别器的损失。函数使用给定的判别器(d_net
)对真实样本(x_real
)和生成样本(x_fake
)进行预测,并通过 sigmoid 激活函数将预测结果映射到 [0, 1] 范围内。然后,函数计算了两个损失项:真实样本的损失(-E[D(x_real)]
)和生成样本的损失(E[D(x_fake)]
)。这两个损失项相加后得到鉴别器的总损失,这个损失用于优化鉴别器网络。
python
def D_WLoss(d_net: torch.nn.Module, x_real: torch.Tensor, x_fake: torch.Tensor) -> torch.Tensor:
# 输入参数:
# d_net: 判别器模型
# x_real: 真实样本
# x_fake: 生成样本
# 使用判别器对真实样本和生成样本进行预测,得到预测结果,并通过 sigmoid 激活函数
pred_real = torch.sigmoid(d_net(x_real))
pred_fake = torch.sigmoid(d_net(x_fake.detach()))
# 计算鉴别器的损失(Wasserstein D loss: -E[D(x_real)] + E[D(x_fake)])
dis_loss = -torch.mean(pred_real) + torch.mean(pred_fake)
# 返回鉴别器损失
return dis_loss
def train_model()
这段代码定义了一个函数train_model
,用于训练生成对抗网络(GAN)的生成器和判别器模型。函数接受多个参数,包括生成器模型(r_net
)、判别器模型(d_net
)、训练数据加载器(train_loader
)、测试数据加载器(test_loader
)等等。函数中包含了训练循环,每个epoch会进行一次训练和测试,并根据需要保存模型。
python
def train_model(args, r_net: torch.nn.Module,
d_net: torch.nn.Module,
train_loader: torch.utils.data.DataLoader,
test_loader: torch.utils.data.DataLoader,
r_loss = R_Loss,
d_loss = D_Loss,
lr_scheduler = None,
optimizer_class = torch.optim.Adam,
optim_r_params: dict = {},
optim_d_params: dict = {},
learning_rate: float = 0.001,
scheduler_r_params: dict = {},
scheduler_d_params: dict = {},
batch_size: int = 1024,
max_epochs: int = 40,
epoch_step: int = 1,
save_step: int = 5,
lambd: float = 0.2,
device: torch.device = torch.device('cuda'),
save_path: str = ".") -> tuple:
# 参数说明:
# args: 其他训练参数的配置
# r_net: 生成器模型
# d_net: 判别器模型
# train_loader: 训练数据的数据加载器
# test_loader: 测试数据的数据加载器
# r_loss: 生成器的损失函数,默认为R_Loss
# d_loss: 判别器的损失函数,默认为D_Loss
# lr_scheduler: 学习率调度器,默认为None
# optimizer_class: 优化器类型,默认为torch.optim.Adam
# optim_r_params: 生成器优化器的参数,默认为空字典
# optim_d_params: 判别器优化器的参数,默认为空字典
# learning_rate: 初始学习率,默认为0.001
# scheduler_r_params: 生成器学习率调度器的参数,默认为空字典
# scheduler_d_params: 判别器学习率调度器的参数,默认为空字典
# batch_size: 批大小,默认为1024
# max_epochs: 最大训练轮数,默认为40
# epoch_step: 每隔多少轮打印训练信息,默认为1
# save_step: 每隔多少轮保存模型,默认为5
# lambd: R_Loss中的lambda参数,默认为0.2
# device: 训练设备,默认为'cuda'
# save_path: 模型保存路径,默认为当前目录
# 创建生成器和判别器的优化器
optim_r = optimizer_class(r_net.parameters(), lr=learning_rate, **optim_r_params)
optim_d = optimizer_class(d_net.parameters(), lr=learning_rate, **optim_d_params)
# 创建学习率调度器
if lr_scheduler:
scheduler_r = lr_scheduler(optim_r, **scheduler_r_params)
scheduler_d = lr_scheduler(optim_d, **scheduler_d_params)
logger = log() # 日志记录器
# 开始训练循环
for epoch in range(max_epochs):
start = timer() # 记录每轮开始时间
# 训练一个epoch并获取训练指标
train_metrics = train_single_epoch(r_net, d_net, optim_r, optim_d, r_loss, d_loss, train_loader, lambd, device)
# 测试模型并获取测试指标
gt, pre = test_metrics = test_single_epoch(r_net, d_net, r_loss, d_loss, test_loader, device)
# 记录测试结果
# logger.print_result(gt, pre, (r_net, d_net), args.seed, args)
time = timer() - start # 记录每轮训练时间
# 每隔一定轮数打印训练信息
if epoch % epoch_step == 0:
print(f'Epoch {epoch}:')
# print('Train Metrics:', train_metrics)
# print('Test Metrics:', test_metrics)
# print(f'TIME: {time:.2f} s')
# 学习率调度器进行一步学习率更新
if lr_scheduler:
scheduler_r.step()
scheduler_d.step()
# 每隔一定轮数保存模型
# if epoch % save_step == 0:
# torch.save(r_net.state_dict(), os.path.join(save_path, "r_net_{}.pt".format(epoch)))
# torch.save(d_net.state_dict(), os.path.join(save_path, "d_net_{}.pt".format(epoch)))
# print(f'Saving model on epoch {epoch}')
# 返回训练好的生成器和判别器模型
return (r_net, d_net)
def train_single_epoch()
这段代码定义了一个函数`train_single_epoch`,用于训练一个epoch。在每个batch的训练中,首先将真实数据传入判别器,计算判别器损失,并更新判别器的参数。然后,将真实数据传入生成器生成假数据,计算生成器损失(包括重构损失和对抗损失),并更新生成器的参数。最后,将每个batch的损失累加,并计算每个样本的平均损失。函数返回一个包含平均损失的字典。
python
def train_single_epoch(r_net, d_net, optim_r, optim_d, r_loss, d_loss, train_loader, lambd, device) -> dict:
# 参数说明:
# r_net: 生成器模型
# d_net: 判别器模型
# optim_r: 生成器的优化器
# optim_d: 判别器的优化器
# r_loss: 生成器的损失函数
# d_loss: 判别器的损失函数
# train_loader: 训练数据的数据加载器
# lambd: R_Loss中的lambda参数
# device: 训练设备
r_net.train() # 设置生成器为训练模式
d_net.train() # 设置判别器为训练模式
train_metrics = {'rec_loss': 0, 'gen_loss': 0, 'dis_loss': 0} # 初始化训练指标
for data, _, idx in train_loader:
x = data.to(device) # 将数据移动到指定设备上
x = torch.transpose(x, dim0=2, dim1=3) # 调整输入数据的维度
x_real = x.reshape(x.shape[0], x.shape[1] * x.shape[2], x.shape[3]) # 调整输入数据的形状
x_fake = r_net(x_real) # 通过生成器生成假数据
d_net.zero_grad() # 判别器梯度清零
dis_loss = d_loss(d_net, x_real, x_fake) # 计算判别器损失
dis_loss.backward() # 反向传播并更新判别器参数
optim_d.step() # 判别器优化器更新
r_net.zero_grad() # 生成器梯度清零
r_metrics = r_loss(d_net, x_real, x_fake, lambd) # 计算生成器损失,包含重构损失和对抗损失
r_metrics['L_r'].backward() # 反向传播并更新生成器参数
optim_r.step() # 生成器优化器更新
# 累加每个batch的损失
train_metrics['rec_loss'] += r_metrics['rec_loss']
train_metrics['gen_loss'] += r_metrics['gen_loss']
train_metrics['dis_loss'] += dis_loss
# 计算每个样本的平均损失
train_metrics['rec_loss'] = train_metrics['rec_loss'].item() / (len(train_loader.dataset) / train_loader.batch_size)
train_metrics['gen_loss'] = train_metrics['gen_loss'].item() / (len(train_loader.dataset) / train_loader.batch_size)
train_metrics['dis_loss'] = train_metrics['dis_loss'].item() / (len(train_loader.dataset) / train_loader.batch_size)
return train_metrics # 返回训练指标字典
def validate_single_epoch()
这段代码定义了一个函数validate_single_epoch
,用于在验证集上评估模型。与训练过程类似,首先将真实数据传入判别器,计算判别器损失。然后,将真实数据传入生成器生成假数据,计算生成器损失。最后,将每个batch的损失累加,并计算每个样本的平均损失。函数返回一个包含平均损失的字典。
python
def validate_single_epoch(r_net, d_net, r_loss, d_loss, valid_loader, device) -> dict:
# 参数说明:
# r_net: 生成器模型
# d_net: 判别器模型
# r_loss: 生成器的损失函数
# d_loss: 判别器的损失函数
# valid_loader: 验证数据的数据加载器
# device: 训练设备
r_net.eval() # 设置生成器为评估模式
d_net.eval() # 设置判别器为评估模式
valid_metrics = {'rec_loss': 0, 'gen_loss': 0, 'dis_loss': 0} # 初始化验证指标
with torch.no_grad():
for data, _, idx in valid_loader:
x = data.to(device) # 将数据移动到指定设备上
x = torch.transpose(x, dim0=2, dim1=3) # 调整输入数据的维度
x_real = x.reshape(x.shape[0], x.shape[1] * x.shape[2], x.shape[3]) # 调整输入数据的形状
x_fake = r_net(x_real) # 通过生成器生成假数据
dis_loss = d_loss(d_net, x_real, x_fake) # 计算判别器损失
r_metrics = r_loss(d_net, x_real, x_fake, 0) # 计算生成器损失,lambda参数为0表示不使用重构损失
# 累加每个batch的损失
valid_metrics['rec_loss'] += r_metrics['rec_loss']
valid_metrics['gen_loss'] += r_metrics['gen_loss']
valid_metrics['dis_loss'] += dis_loss
# 计算每个样本的平均损失
valid_metrics['rec_loss'] = valid_metrics['rec_loss'].item() / (len(valid_loader.dataset) / valid_loader.batch_size)
valid_metrics['gen_loss'] = valid_metrics['gen_loss'].item() / (len(valid_loader.dataset) / valid_loader.batch_size)
valid_metrics['dis_loss'] = valid_metrics['dis_loss'].item() / (len(valid_loader.dataset) / valid_loader.batch_size)
return valid_metrics # 返回验证指标字典
def test_single_epoch()
这段代码定义了一个函数test_single_epoch
,用于在测试集上评估模型。与验证过程类似,首先将真实数据传入判别器,计算判别器损失,并将损失值添加到损失列表中。然后,将损失列表的元素合并为一个Tensor,并将NaN值替换为0。接着,使用roc_auc_score
函数计算ROC AUC得分,并将结果打印出来。函数返回真实标签和负的损失值,用于ROC AUC计算。
python
def test_single_epoch(r_net, d_net, r_loss, d_loss, test_loader, device) -> dict:
# 参数说明:
# r_net: 生成器模型
# d_net: 判别器模型
# r_loss: 生成器的损失函数
# d_loss: 判别器的损失函数
# test_loader: 测试数据的数据加载器
# device: 训练设备
r_net.eval() # 设置生成器为评估模式
d_net.eval() # 设置判别器为评估模式
valid_metrics = {'rec_loss': 0, 'gen_loss': 0, 'dis_loss': 0} # 初始化验证指标
loss = [] # 初始化损失列表
with torch.no_grad():
for data, _, idx in test_loader:
x = data.to(device) # 将数据移动到指定设备上
x = torch.transpose(x, dim0=2, dim1=3) # 调整输入数据的维度
x_real = x.reshape(x.shape[0], x.shape[1] * x.shape[2], x.shape[3]) # 调整输入数据的形状
dis_loss = d_net(x_real).squeeze().cpu() # 计算判别器损失,并将结果移回CPU
loss.append(dis_loss) # 将损失添加到损失列表中
loss = torch.cat(loss) # 将损失列表合并为一个Tensor
loss = np.nan_to_num(loss) # 将NaN值替换为0
auc_score = roc_auc_score(np.asarray(test_loader.dataset.label, dtype=int), -loss) # 计算ROC AUC得分
print('roc_test', auc_score) # 打印测试集的ROC AUC得分
return np.asarray(test_loader.dataset.label, dtype=int), -loss # 返回真实标签和负的损失值(用于ROC AUC计算)