人工智能学习概述---快手视频
人工智能学习38-VGG训练---快手视频
人工智能学习39-VGG训练---快手视频
人工智能学习40-VGG训练---快手视频
人工智能学习41-VGG训练---快手视频
人工智能学习42-VGG预测---快手视频
人工智能学习43-VGG预测---快手视频
人工智能学习44-VGG总结---快手视频
10类猕猴样本文件
通过网盘分享的文件:monkey10_species.zip
链接: https://pan.baidu.com/s/1faHJMdUasnlGUX_FVPgJNg 提取码: 5abn
VGG16 训练10类猕猴识别示例
python
#导入VGG16类库
from keras.applications.vgg16 import VGG16,preprocess_input
#从keras.layers 导入全连接层
from keras.layers import Dense
#keras.preprocessing.image 导入图像增强工具
from keras.preprocessing.image import ImageDataGenerator
#引入numpy类库,方便矩阵操作
import numpy as np
#导入图形处理类库
import matplotlib.pyplot as plt
#从keras导入顺序模块Sequential
from keras import Sequential
#导入OS模块,方便操作文件与目录
import os
#避免多库依赖警告信息
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'
#设置神经网络模型存储目录,当前python源文件所在目录上一级下的saved_models目录
save_dir = os.path.join(os.getcwd(), "../saved_models")
#如果目录saved_models不存在,新建此目录
if not os.path.isdir(save_dir):
os.makedirs(save_dir)
#神经网络模块名称
model_name = 'finetune_vgg16_trained_model.h5'
#输入图像高度(单位:像素)
height = 224
#输入图像宽度(单位:像素)
width = 224
#VGG16 类库使用已经训练好的模型进行迁移学习,增加一种新的动物,在原模型基础上
#训练新模型可以识别新增加的动物,原模型可以识别10种猕猴
num_classes = 11
#定义Keras顺序模型Sequential
vgg16Model = Sequential()
#构建新模型,添加第一层为VGG16层,VGG16层中已经包含16层网络
#此处将VGG16合并为第一层
vgg16Model.add(VGG16(
include_top=False,
pooling='avg',
weights='imagenet'
))
#添加一个全连接层,使其可以识别11类动物,使用激活函数softmax
#预测输出
vgg16Model.add(Dense(num_classes,activation='softmax'))
#设置网络第一层不参与训练(也就是VGG16,其已经训练完成)
vgg16Model.layers[0].trainable = False
#编译网络模型,优化器采用梯度下降法,损失函数采用交叉熵
#统计信息设置为准确度
vgg16Model.compile(
optimizer="sgd",
loss="categorical_crossentropy",
metrics=['acc']
)
#模型结构汇总输出
vgg16Model.summary()
#定义训练数据集增强类
train_datagen = ImageDataGenerator(
preprocessing_function=preprocess_input,#使用 VGG16 定义输入函数
rotation_range=40,# 随机旋转的度数范围,表示图像将随机旋转0到40度
width_shift_range=0.2,# 表示图像在水平上随机移动的范围
height_shift_range=0.2,# 表示图像在垂直方向上随机移动的范围
shear_range=0.2,# 随机剪切变换的角度范围,图像将随机剪切0到20度的角度
zoom_range=0.2,# 随机缩放的范围,图像将随机缩放90%到110%
horizontal_flip=True,# 是否进行水平翻转
fill_mode='nearest'#当变换导致某些像素需要被填充时使用的填充方法,'nearest'
表示使用最近的像素进行填充
)
#定义验证数据集增强类
vaild_datagen = ImageDataGenerator(
preprocessing_function=preprocess_input
)
#小批量训练模式下每次训练样本数量
batch_size = 32
#训练集数据增强生成器
train_generator = train_datagen.flow_from_directory(
"../monkey10_species/training/training",#训练图片所在目录
target_size=(height,width),#图片尺寸大小
batch_size=batch_size,#每次训练样品批量
seed=10,# 指定随机数种子,用于洗牌操作的随机性
shuffle=True,#是否对样品数据洗牌
class_mode='categorical'#指定标签的类型,可以是"categorical"(多分类问题)、
"binary"(二分类问题)、"sparse"(稀疏标签问题)或"None"(无标签问题)
)
#训练集样品总量
train_num = train_generator.samples
#验证集数据增强生成器
valid_generator = vaild_datagen.flow_from_directory(
"../monkey10_species/validation/validation",
target_size=(height,width),
batch_size=batch_size,
seed=10,
shuffle=False,
class_mode='categorical'
)
#验证集样品总量
valid_num = valid_generator.samples
#开始训练模型,匹配训练集与标注真实数值映射关系
history = vgg16Model.fit_generator(
train_generator,#训练集生成器
steps_per_epoch=train_num // batch_size,# 定义了一个 epoch 中应抽取的步数(批
次数量)
epochs=5,#训练次数
validation_data=valid_generator,#测试集生成器
validation_steps=valid_num // batch_size
)
# 保存模型
model_path = os.path.join(save_dir, model_name);
vgg16Model.save(model_path)
#从history 对象中获取准确度核损失统计信息
acc = history.history['acc'] #训练集准确度
val_acc = history.history['val_acc'] #验证集准确度
loss = history.history['loss'] #训练集损失
val_loss = history.history['val_loss'] #验证集损失
Epochs = range(1, len(acc) + 1)
#训练集准确度曲线
plt.plot(Epochs, acc, "bo", label='Train Accuracy')
#验证集准确度曲线
plt.plot(Epochs, val_acc, "b", label='Validation Accuracy')
plt.title('Train and Validation Accuracy')
plt.legend()
#显示图形窗口
plt.show()
#训练集损失曲线
plt.plot(Epochs, loss, "ro", label='Train Loss')
#验证集损失曲线
plt.plot(Epochs, val_loss, "r", label='Validation Loss')
plt.title('Train and Validation Loss')
plt.legend()
#显示图形窗口
plt.show()
VGG16 预测10类猕猴示例
python
#导入VGG16类库
from keras.applications.vgg16 import preprocess_input
#导入图像处理库
from keras.preprocessing import image
#导入装载模型方法load_model
from keras.saving.save import load_model
#引入numpy类库,方便矩阵操作
import numpy as np
#引入json类库
import json
#引入sys类库
import sys
#导入OS模块,方便操作文件与目录
import os
#避免多库依赖警告信息
os.environ['KMP_DUPLICATE_LIB_OK'] = 'True'
#设置神经网络模型存储目录,当前python源文件所在目录上一级下的saved_models目录
save_dir = os.path.join(os.getcwd(), '../saved_models')
#如果目录saved_models不存在,新建此目录
if not os.path.isdir(save_dir):
os.makedirs(save_dir)
#神经网络模块名称
model_name = 'finetune_vgg16_trained_model.h5'
#神经网络模块所在目录
model_path = os.path.join(save_dir, model_name)
#装载神经网络模型
model = load_model(model_path)
#定义输入图片变量
img_path = None
#命令行输入参数数组
arguments = sys.argv[1:2]
#如果数组为空,img_path设置为默认图片
if len(arguments) == 0:
img_path = '../dog1.jpg'
else:
img_path = arguments[0] #第一个参数为图片文件
#由图片文件名称转载图片数据
img = image.image_utils.load_img(img_path, target_size=(224, 224))
#图片数据转化为数组
x = image.image_utils.img_to_array(img)
#扩展图片数组维度,第一维扩展维图片样本数量
x = np.expand_dims(x, axis=0)
#由VGG16提供数据载入函数装载图片数据
x = preprocess_input(x)
#模型预测输入图片的动物分类
pred = model.predict(x)
print('Predict:', pred[0])
list = pred[0]
pos = 0
#显示所有预测分类概率
for i in list:
print(pos, '=', i)
pos = pos + 1
#显示预测概率最大的分类
print('argmax=', pred.argmax())
