DAY12 Tensorflow 六步法搭建神经网络

六步法:

一.import

导入各种库,比如:

python 复制代码
import tensorflow as tf
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras import Model
import numpy as np
import pandas as pd
# 可能还会根据需求导入其他库,如用于数据可视化的 matplotlib 等
import matplotlib.pyplot as plt

二.train,test

准备训练数据和测试数据,比如:

python 复制代码
# 以 MNIST 数据集为例
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 数据预处理
x_train, x_test = x_train / 255.0, x_test / 255.0

首先,从相应的数据集中加载数据,如这里使用 mnist.load_data() 加载 MNIST 手写数字数据集,得到训练集的特征 x_train 和标签 y_train,以及测试集的特征 x_test 和标签 y_test。然后,对数据进行预处理,常见的预处理操作包括归一化、标准化等。在上述代码中,将图像像素值除以 255,将其缩放到 0 到 1 的范围,这有助于模型的训练和收敛。

三.model=tf.keras.models.Sequential

构建模型架构,比如:

python 复制代码
model = tf.keras.models.Sequential([
    Flatten(input_shape=(28, 28)),
    Dense(128, activation='relu'),
    Dense(10, activation='softmax')
])

四.model.compile

配置模型训练过程,比如:

python 复制代码
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

这一步用于配置模型的训练过程,主要设置三个重要参数:

optimizer:优化器,用于调整模型的参数以最小化损失函数。adam 是一种常用的优化器,它结合了 AdaGrad 和 RMSProp 的优点,具有自适应学习率的能力。

loss:损失函数,用于衡量模型预测结果与真实标签之间的差异。其中sparse_categorical_crossentropy 适用于标签为整数编码的多分类问题。

metrics:评估指标,用于在训练和测试过程中监控模型的性能。accuracy 表示准确率,即模型预测正确的样本数占总样本数的比例。

五,model.fit

进行模型训练,使用训练模型进行迭代训练。

python 复制代码
model.fit(x_train, y_train, epochs=5)

六,model.summary

这一步用于打印模型的结构信息,包括每一层的名称、输出形状和参数数量等。通过查看 model.summary() 的输出,你可以了解模型的整体架构和参数规模,帮助你检查模型是否符合预期,以及评估模型的复杂度。

python 复制代码
model.summary()

各自的使用方法:

Flatten只是把数值特征拉成一维数组

Dense全连接

后面是卷积神经网络层和循环神经网络层

compile配置训练方法。

validation_data和validation_split二选一,进行训练。

validation_freq 多少轮训练后用测试集测试一次。

model.summary()打印出统计结果,其中可以看到,总共的参数15个,可训练参数15个,不可训练参数0个。

以下是用六步法搭建鸢尾花分类。

python 复制代码
import tensorflow as tf
from sklearn import datasets
import numpy as np

x_train = datasets.load_iris().data
y_train = datasets.load_iris().target

np.random.seed(116)
np.random.shuffle(x_train)
np.random.seed(116)
np.random.shuffle(y_train)
tf.random.set_seed(116)

model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(3, activation='softmax', kernel_regularizer=tf.keras.regularizers.l2())
])

model.compile(optimizer=tf.keras.optimizers.SGD(lr=0.1),
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False),
              metrics=['sparse_categorical_accuracy'])

model.fit(x_train, y_train, batch_size=32, epochs=500, validation_split=0.2, validation_freq=20)

model.summary()

首先import,然后两个train交代训练集和测试集。

np到tf这几个random用于打乱数据集设置。

model中设置网络结构。3指的是神经元个数是3,activation选用激活函数,最后是选用正则化方法。

complie中配置训练方法,SGD优化器,学习率0.1,选用SparseCategoricalCrossentropy当做损失函数,由于神经末端使用softmax函数,输出不是原始分布,所以logits=False。

鸢尾花数据集给的是0,1,2是数值,神经网络前向输出是概率分布,选择sparse_categorical_accuracy作为测评指标。

fit中执行训练过程,分别是 输入特征,训练集标签,训练时一次喂给神经网络多少组数据batch_size,循环迭代次数,validation_split=0.2告知从训练集中选择百分之20数据当做测试集,validation_freq=20,表示迭代20次,在测试集中验证一次准确率。

运行结果:

可见,打印出了网络结构和参数统计。

相关推荐
NQBJT2 分钟前
万字拆解 NeckFix:AI 脖子前倾检测的算法原理与工程实现
人工智能·算法
数智工坊9 分钟前
【Inner Monologue论文阅读】: 首次将大语言模型嵌入机器人控制闭环,实现自我反思和动态行为调整
论文阅读·人工智能·算法·语言模型·机器人·无人机
AI帮小忙16 分钟前
Debian/Ubuntu 系linux操作系统Kali Linux 2026 里安装 Hermes Agent
人工智能
乌恩大侠18 分钟前
基站正在成为 AI 计算节点:NVIDIA Aerial 推动 RAN 架构重构
人工智能·重构·架构
钓了猫的鱼儿23 分钟前
基于深度学习+AI的水下目标目标检测与预警系统(Python源码+数据集+UI可视化
人工智能·深度学习·智能手机
Ting-yu26 分钟前
Spring AI Alibaba零基础速成(6) ---- 向量化
数据库·人工智能
YUDAMENGNIUBI28 分钟前
day29_NLP概念与文本预处理
人工智能·自然语言处理
南屹川29 分钟前
【安全】代码安全审计与防护实践
人工智能
深开鸿31 分钟前
福田区全栈式鸿蒙AI数智机关入选全市首批OR示范应用项目,深开鸿筑牢政务安全底座
人工智能·openharmony·政务
进度猫31 分钟前
八款项目管理软件对比:功能、局限与适用团队
人工智能·项目管理·产品经理·甘特图·项目管理软件