pytorch Loss Functions

1. pytorch中loss函数使用方法示例

python 复制代码
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.autograd import Variable

# 定义网络时需要继承nn.Module并实现它的forward方法,将网络中具有可学习参数的层放在构造函数__init__中
# 不具有可学习参数的层(如ReLu)既可以放在构造函数中也可以不放

# torch.nn.MaxPool2d和torch.nn.functional.max_pool2d,在pytorch构建模型中,都可以作为最大池化层的引入,但前者为类模块,后者为函数,在使用上存在不同。
# torch.nn.functional.max_pool2d是函数,可以直接调用;torch.nn.MaxPool2d是类模块,要先实例化,再调用其函数。
# torch.nn中其它模块跟torch.nn.functional中其它对应的函数也是类似的用法。
class myNet(torch.nn.Module):
    def __init__(self):
        super(myNet, self).__init__()

        self.conv1 = torch.nn.Conv2d(1,6,5)
        self.conv2 = torch.nn.Conv2d(6,16,5)

        self.fc1 = torch.nn.Linear(16*5*5,120)
        self.fc2 = torch.nn.Linear(120, 84)
        self.fc3 = torch.nn.Linear(84, 10)

        self.pooling = torch.nn.MaxPool2d(2)
        self.activate = torch.nn.ReLU()

    def forward(self, x):
        x = self.pooling(self.activate(self.conv1(x)))
        x = self.pooling(self.activate(self.conv2(x)))
        x = x.view(x.size()[0], -1)
        x = self.activate(self.fc1(x))
        x = self.activate(self.fc2(x))
        x = self.fc3(x)

        return x

input = Variable(torch.randn(1,1,32,32))
net = myNet()          # 创建myNet()对象
output = net(input)    # 调用myNet()对象的forward()方法,有点类似C++中的operator()()
target = Variable(torch.arange(0, 10))
citerion = torch.nn.MSELoss()                    # 创建MSELoss()对象
loss = citerion(output.float(), target.float())  # 调用loss函数
print(loss)

print('*'*30)

net.zero_grad()   # 把net中所有可学习参数的梯度清零
print(net.conv1.bias.grad)
loss.backward()
print(net.conv1.bias.grad)

输出结果:

bash 复制代码
tensor(28.6363, grad_fn=<MseLossBackward0>)
******************************
None
tensor([ 0.1782, -0.0815, -0.0902, -0.0140,  0.0267,  0.0015])

2. pytorch官方支持的loss

https://pytorch.org/docs/stable/nn.html#loss-functions

相关推荐
有泽改之_3 分钟前
Garmin FIT协议与FIT Activity文件类型
网络·python
a***97683 分钟前
Python大数据可视化:基于大数据技术的共享单车数据分析与辅助管理系统_flask+hadoop+spider
大数据·python·信息可视化
love530love5 分钟前
【笔记】解决 Stable Diffusion WebUI 启动 “找不到llama_cpp模块”
运维·windows·笔记·python·stable diffusion·github·llama
h***67377 分钟前
Flask:后端框架使用
后端·python·flask
MediaTea11 分钟前
Python 库手册:gc 垃圾回收
java·开发语言·jvm·python·算法
红蒲公英12 分钟前
( 教学 )Agent 构建 Prompt(提示词)2. CommaSeparatedListOutputParser
人工智能·python·langchain·prompt·langgraph
v***431713 分钟前
Elasticsearch(ES)基础查询语法的使用
python·elasticsearch·django
子午1 小时前
【民族服饰识别系统】Python+TensorFlow+Vue3+Django+人工智能+深度学习+卷积网络+resnet50算法
人工智能·python·深度学习
QxQ么么6 小时前
移远通信(桂林)26校招-助理AI算法工程师-面试纪录
人工智能·python·算法·面试
执笔论英雄7 小时前
Slime异步原理(单例设计模式)4
开发语言·python·设计模式