PyTorch – 逻辑回归

data

首先导入torch里面专门做图形处理的一个库,torchvision,根据官方安装指南,你在安装pytorch的时候torchvision也会安装。

我们需要使用的是torchvision.transforms和torchvision.datasets以及torch.utils.data.DataLoader

首先DataLoader是导入图片的操作,里面有一些参数,比如batch_size和shuffle等,默认load进去的图片类型是PIL.Image.open的类型,如果你不知道PIL,简单来说就是一种读取图片的库

torchvision.transforms里面的操作是对导入的图片做处理,比如可以随机取(50, 50)这样的窗框大小,或者随机翻转,或者去中间的(50, 50)的窗框大小部分等等,但是里面必须要用的是transforms.ToTensor(),这可以将PIL的图片类型转换成tensor,这样pytorch才可以对其做处理

torchvision.datasets里面有很多数据类型,里面有官网处理好的数据,比如我们要使用的MNIST数据集,可以通过torchvision.datasets.MNIST()来得到,还有一个常使用的是torchvision.datasets.ImageFolder(),这个可以让我们按文件夹来取图片,和keras里面的flow_from_directory()类似,具体的可以去看看官方文档的介绍。

|-------------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | # 定义超参数 batch_size = 32 learning_rate = 1e-3 num_epoches = 100 # 下载训练集 MNIST 手写数字训练集 train_dataset = datasets.MNIST(root=\'./data\', train=True, transform=transforms.ToTensor(), download=True) test_dataset = datasets.MNIST(root=\'./data\', train=False, transform=transforms.ToTensor()) train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True) test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False) |

以上就是我们对图片数据的读取操作

model

之前讲过模型定义的框架,废话不多说,直接上代码

|----------------------|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 2 3 4 5 6 7 8 9 10 | class Logstic_Regression(nn.Module): def init(self, in_dim, n_class): super(Logstic_Regression, self).init() self.logstic = nn.Linear(in_dim, n_class) def forward(self, x): out = self.logstic(x) return out model = Logstic_Regression(28*28, 10) # 图片大小是28x28 |

我们需要向这个模型传入参数,第一个参数定义为数据的维度,第二维数是我们分类的数目。

接着我们可以在gpu上跑模型,怎么做呢?

首先可以判断一下你是否能在gpu上跑

|---|--------------------------|
| 1 | torh.cuda.is_available() |

如果返回True就说明有gpu支持

接着你只需要一个简单的命令就可以了

|-----------|--------------------------------------|
| 1 2 3 4 5 | model = model.cuda() 或者 model.cuda() |

然后需要定义loss和optimizer

|-----|-----------------------------------------------------------------------------------------------|
| 1 2 | criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(model.parameters(), lr=learning_rate) |

这里我们使用的loss是交叉熵,是一种处理分类问题的loss,optimizer我们还是使用随机梯度下降

train

接着就可以开始训练了

|-------------------------------------------------------------------|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 | for epoch in range(num_epoches): print(\'epoch {}\'.format(epoch 1)) print(\'*\'*10) running_loss = 0.0 running_acc = 0.0 for i, data in enumerate(train_loader, 1): img, label = data img = img.view(img.size(0), -1) # 将图片展开成 28x28 if use_gpu: img = Variable(img).cuda() label = Variable(label).cuda() else: img = Variable(img) label = Variable(label) # 向前传播 out = model(img) loss = criterion(out, label) running_loss = loss.data[0] * label.size(0) _, pred = torch.max(out, 1) num_correct = (pred == label).sum() running_acc = num_correct.data[0] # 向后传播 optimizer.zero_grad() loss.backward() optimizer.step() |

注意我们如果将模型放到了gpu上,相应的我们的Variable也要放到gpu上,也很简单

|-----|-----------------------------------------------------------|
| 1 2 | img = Variable(img).cuda() label = Variable(label).cuda() |

然后可以测试模型,过程与训练类似,只是注意要将模型改成测试模式

|---|--------------|
| 1 | model.eval() |

这是跑完100 epoch的结果

具体的结果多久打印一次,如何打印可以自己在for循环里面去设计。

相关代码:pytorch-beginner: pytorch-beginner

相关推荐
captain_AIouo1 小时前
Captain AI以数据为核心,打造OZON智能决策引擎
大数据·人工智能·经验分享·aigc
ALINX技术博客1 小时前
AMD VU FPGA+NVIDIA Thor AI 超高性能异构平台 ALINX HEA13,支撑新一代边缘 AI 系统
人工智能·fpga开发
TENSORTEC腾视科技1 小时前
AI赋能 车行无忧|腾视科技ES10终端,为车辆装上“智慧大脑”
人工智能·科技·ai·零售·无人叉车及智能调度系统解决方案
chatexcel1 小时前
AI PPT生成学术展演文稿实操教程:提示词设计与生成流程详解
人工智能·powerpoint
科研前沿1 小时前
实景像素级精准复刻,夯实动态真孪生底座——原生自研技术壁垒,领航视频孪生产业发展
人工智能·音视频
w1wi2 小时前
【Vibe Coding】TCP/UDP包篡改重放工具
人工智能·网络协议·tcp/ip·ai·udp·ai编程
ZPC82102 小时前
CPU 核心隔离 + 线程绑核 + 实时优先级 SCHED_FIFO
人工智能·算法·计算机视觉·机器人
码农杂谈00072 小时前
制造业供应链管理系统快速搭建:AI 开发效率提升指南
人工智能·低代码
Aloudata2 小时前
AI 时代如何通过主动元数据构建高质量、可追溯的语义底座?
大数据·人工智能·数据治理·元数据·数据血缘
andafaAPS2 小时前
安达发|aps自动排产排程排单软件:日化生产高效运转“数字魔法”
大数据·人工智能·算法·aps软件·安达发aps·aps自动排产排程排单软件