【python】神经网络

构建神经网络的典型流程

  1. 定义一个拥有可学习参数的神经网络

  2. 遍历训练数据集

  3. 处理输入数据使其流经神经网络

  4. 计算损失值

  5. 将网络参数的梯度进行反向传播

  6. 以一定的规则更新网络的权重

卷积神经网络(pytorch自己写的,建议用第三方包)

导包

复制代码
from __future__ import print_function
import torch
import torch.nn as nn
import torch.nn.functional as F

建立神经网络类

复制代码
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # 定义第一层卷积神经网络,输入通道为3,输出通道为6,卷积核大小为5*5
        self.conv1 = nn.Conv2d(3, 6, 5)
        # 定义第二层卷积神经网络,输入通道为6,输出通道为16,卷积核大小为5*5
        self.conv2 = nn.Conv2d(6, 16, 5)
        # 定义全连接层
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        # 在池化层窗口下进行池化操作
        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

    def num_flat_features(self, x):
        size = x.size()[1:]  # 除去批处理维度的其他所有维度
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

使用

复制代码
net=Net()
param=list(net.parameters())
print(len(param))
print(param[0].size())
input=torch.randn(1,3,32,32)
out=net(input)
print(out)
相关推荐
小小199216 小时前
vue 单页面请求
开发语言·前端·javascript
hhb_61816 小时前
JavaScript 本地存储与动态数据渲染实战案例
开发语言·javascript·ecmascript
iAm_Ike16 小时前
怎么关闭MongoDB不需要的HTTP管理接口及REST API
jvm·数据库·python
淀粉肠kk16 小时前
【C++11】智能指针详解
开发语言·c++
hrhcode16 小时前
【LangChain】一.LangChain v1.0-快速上手(核心组件、工具、中间件)
python·ai·langchain·agent
SunnyDays101116 小时前
Python Word 转 Excel 详解(含整个文档、特定页面或表格转换)
python·word 转 excel·docx 转 xlsx·word 表格导出 excel
m0_7411733316 小时前
CSS移动端实现卡片悬浮投影_利用box-shadow设置层次感
jvm·数据库·python
西洼工作室16 小时前
uniapp+vue3+python对接阿里云短信认证服务alibabacloud_dypnsapi20170525
python·阿里云·uni-app
kyriewen1116 小时前
Next.js部署:从本地跑得欢,到线上飞得稳
开发语言·前端·javascript·科技·react.js·前端框架·ecmascript
AI人工智能+电脑小能手16 小时前
【大白话说Java面试题】【Java基础篇】第21题:HashMap和Hashtable的区别是什么
java·开发语言·面试·哈希算法·散列表·hash table