MATLAB环境下基于人工蜂群优化算法的卷积神经网络CNN图像识别

地球上的所有生物包括人类都在不断演变、进化,在这样的过程中逐渐适应了外界的环境,找到了适合自己的生存方式。不同的生物有不同的生存机制,群体活动作为一种常见的生存机制广泛存在于自然界中,例如蚂蚁、鸟群、鱼群、峰群甚至人类等。群体活动的优势在于:通过群体成员协调性的有规则性的行为,克服单个个体能力的局限性,实现了群体的目标,保持了种群的延续。研究者通过观察生物的群体行为,受此启发,同时结合生物学、数学、管理学、计算机等学科,创造了群体智能算法。将生物界的群体价值通过数学思想、计算机模拟算法、管理学思维统一表现出来,诞生了遗传算法、鸟群算法、人工鱼群算法等。人工蜂群算法是新近提出的种群智能算法。

蜜蜂是自然界中社会群居性昆虫中的一种,其中包括了蜂王、雄蜂以及工蜂。蜂群中存在严密的组织和分工,各个蜂种都有各自的工作。一个蜂群中通常只有一只蜂王,经受精卵发育而成,主要任务是产卵繁衍后代;蜂群中有多个雄蜂,由未受精的卵发育而来,主要任务是与蜂王交尾实现后代繁殖;蜂群中最多的是工蜂,是发育不全的雌性蜂,主要任务是采蜜、筑巢、哺育幼蜂等,是整个蜂群中最为勤劳最为辛苦的成员。虽然单只蜜蜂的行为模式非常简单,但是通过他们的协调工作,完成了食物采集、种群繁育、种群防卫等工作,使整个蜂群有效地运作。

研究者受蜂群行为的启发,自年起,提出了多种群体智能算法,包括基于蜂群繁殖行为的蜜蜂婚配算法、蜜蜂交配优化算法、蜂后进化算法等,这些算法在进行高次非线性函数优化的问题,随机动态规划问题,优化解局部搜索以及全局搜索等问题上得到了广泛的应用。其中蜂后进化算法的引入有效的增强了遗传算法的性能,提升了该算法的全局最优解寻优速度。

在此基础上,科研工作者深入研究蜜蜂采蜜的行为,发现蜂群中的工蜂通常只会在一定的范围内收集蜂蜜,而且每次进行釆蜜活动前,大多数工蜂都作为内勤留在蜂巢内,只派出少量工蜂作为侦察蜂,其主要任务是寻找食物源,一旦找到了新的蜜源,就转变为采集蜂,飞回蜂巢并通过""字形舞或圆圈舞等蜜蜂间用来传递信息的独特方式,来展示寻找到的蜜源的包括质量、种类、方位以及距离等相关信息。巢内值内勤的工蜂们还可以通过侦察蜂舞蹈的兴奋程度看出蜜源的质量,在各个蜜源之间选择最好最优的那个,派出尽可能多的内勤去该蜜源采集蜂蜜。在采蜜的过程中,旧的蜜源逐渐消耗殆尽,侦察蜂又会以它们特有的方式继续寻找新的优质蜜源,从而引领内勤放弃已经采集过的蜜源转向新的蜜源。

蜂群之所以能进行高速有效的花蜜采集,最重要的就是花蜜采集过程中蜜蜂职责的有效转换以及各个蜜源收益率信息的实时交互。(工作之初,派出的侦察蜂在蜂巢周围随机寻找蜜源,找到蜜源后,通过"8"字形舞或圆圈舞向等候区的观察蜂展示蜜源所处的方位、蜜源花蜜的种类、蜜源的质量以及数量等信息,通过各个蜜源整体收益率的比较,选取收益率较高的那些蜜源采集花蜜,派出对应数量的采集蜂,然后该侦察蜂转变成引领蜂,带领采集蜂采集该处的花蜜。(在各个蜜源采集的过程中,各个蜜源的收益率会实时变化,引领蜂时刻记录并存储着这些数据,并与其他蜜蜂交流,收益率上升会使更多的非雇佣蜂转变为雇佣蜂,加入该蜜源的采集工作,收益率不变则对应蜜源采集蜂数量不变;收益率下降到一定程度则放弃该蜜源,采集花蜜的雇佣蜂回到蜂巢转变为非雇佣蜂,随机作为侦察蜂或观察蜂,进入下一次采集工作。与此同时,在花蜜采集的过程中,不管各个蜜源质量好坏,整个群体作为侦察蜂的工蜂数目一直保持5%~10%的数目,持续在蜂巢周围寻找新的优质的蜜源,以取代收益率下降的劣质蜜源。通过这样的过程,蜂群可以一直保持很高的收益率,找到最优值的蜜源,可以在最短的时间内采集到更多更优质的花蜜。

当使用神经网络对输入的数据进行训练时,程序初始化一组值,用适应度函数评价网络训练结果与期望值的误差,然后进入迭代过程,使用误差梯度下降法相应调整权值和阈值,以实现最终的优化目标。采用人工蜂群算法对神经网络进行优化具有以下几个优点:

(1)引入人工蜂群的种群概念后,使用神经网络进行训练时,程序初始化N组m维向量,N是初始种群数目,即蜜源数目。种群的每个初始值都是在权值和阈值取值范围内随机产生的,在种群数目足够的情况下,初始种群均匀分布在多峰问题连接权空间中。有效地避免了神经网络学习训练时,单一初始值可能造成的陷入局部最小值,从而无法找到全局最优值。

(2)引入种群概念后,改变了传统神经网络初始化时只有一组值,只能在一个维度上实现误差的调整的现状。种群中的每一个初始化值对应了一个网络,同时计算出该组值对应网络的输出误差,同时在多个维度使用梯度下降法调整各个网络的参数,实现神经网络误差的快速收敛。更重要的是,人工蜂群算法引入的侦察蜂概念,主要针对网络训练时,初始化权值和阈值逐步调整的过程中,可能陷入局部最小值,导致该组值无法继续完成最优权值和阈值的搜索的问题,在达到设定的停滞次数时,即神经网络训练迭代过程中误差不能继续优化减小的次数,直接跳出该点,在取值范围内随机产生一组新解,继续全局最优值的搜寻工作,避免了陷入局部最小值导致无法继续训练以及增加无谓的计算量等问题,加快了神经网络整体寻优的进度。

(3)在神经网络训练的整个过程中,算法具有记忆功能,在每次的迭代时,通过适应度函数的大小比较,控制种群中每组值更新与否,始终记录适应度值更优的位置。通过全局适应度值的比较找到了每次迭代过程中全局的最优一组值,从而控制算法是否继续,避免了无记忆功能时造成的重复训练等问题,也加快了网络训练的速度。

(4)人工蜂群算法引入轮赌盘选择策略,即在每步迭代的过程中,由各个位置的适应度计算对应的选择概率,并由轮赌盘机制选择概率高的位置附近进行搜索和位置更新。选择机制中由各个位置的适应度计算被选择概率,适应度高的对应的概率大,对应的被选中的几率也越大。可以理解为,轮赌盘选择机制为放大镜作用,使用该机制对适应度值较大的位置进行更细化的搜索,以便找到更优的位置;忽略适应度较低的位置,减少计算量。

鉴于人工蜂群优化算法和卷积神经网络CNN的优势,提出一种基于人工蜂群优化算法的卷积神经网络CNN图像识别方法,算法程序运行环境为MATLAB R2021B,采用蜜蜂优化算法对CNN进行优化,即采用蜜蜂优化算法拟合CNN的权重和偏差。

部分代码如下:

%% Cleaning
 clear;
 clc;
 warning('off');
%% CNN Deep Neural Network
% Load the deep sample data as an image datastore. 
deepDatasetPath = fullfile('CNNDat');
imds = imageDatastore(deepDatasetPath, ...
    'IncludeSubfolders',true, ...
    'LabelSource','foldernames');
% Divide the data into training and validation data sets
numTrainFiles = 90;
[imdsTrain,imdsValidation] = splitEachLabel(imds,numTrainFiles,'randomize');
% Define the convolutional neural network architecture.
layers = [
% Image Input Layer An imageInputLayer 
    imageInputLayer([64 64 1])
% Convolutional Layer 
convolution2dLayer(3,8,'Padding','same')
% Batch Normalization 
    batchNormalizationLayer
% ReLU Layer The batch
    reluLayer
% Max Pooling Layer  
    % More values means less weights
    maxPooling2dLayer(4,'Stride',4)
    %------------------------------
    convolution2dLayer(3,8,'Padding','same')
    batchNormalizationLayer
    reluLayer
    maxPooling2dLayer(5,'Stride',5)
    convolution2dLayer(3,8,'Padding','same')
    batchNormalizationLayer
    reluLayer
% Fully Connected Layer (Number of Classes) 
    fullyConnectedLayer(8)
% Softmax Layer 
    softmaxLayer
% Classification Layer The final layer 
    classificationLayer];
% Specify the training options
options = trainingOptions('sgdm', ...
    'InitialLearnRate',0.001, ...
    'MaxEpochs',20, ...
    'Shuffle','every-epoch', ...
    'ValidationData',imdsValidation, ...
    'ValidationFrequency',8, ...
    'Verbose',false, ...
    'Plots','training-progress');
% Train the network 
[net,info]= trainNetwork(imdsTrain,layers,options);

出图如下:

工学博士,担任《Mechanical System and Signal Processing》审稿专家,担任
《中国电机工程学报》优秀审稿专家,《控制与决策》,《系统工程与电子技术》,《电力系统保护与控制》,《宇航学报》等EI期刊审稿专家。

擅长领域:现代信号处理,机器学习,深度学习,数字孪生,时间序列分析,设备缺陷检测、设备异常检测、设备智能故障诊断与健康管理PHM等。

相关推荐
Elastic 中国社区官方博客2 小时前
使用 Elastic AI Assistant for Search 和 Azure OpenAI 实现从 0 到 60 的转变
大数据·人工智能·elasticsearch·microsoft·搜索引擎·ai·azure
江_小_白3 小时前
自动驾驶之激光雷达
人工智能·机器学习·自动驾驶
yusaisai大鱼4 小时前
TensorFlow如何调用GPU?
人工智能·tensorflow
LNTON羚通5 小时前
摄像机视频分析软件下载LiteAIServer视频智能分析平台玩手机打电话检测算法技术的实现
算法·目标检测·音视频·监控·视频监控
哭泣的眼泪4086 小时前
解析粗糙度仪在工业制造及材料科学和建筑工程领域的重要性
python·算法·django·virtualenv·pygame
珠海新立电子科技有限公司7 小时前
FPC柔性线路板与智能生活的融合
人工智能·生活·制造
IT古董7 小时前
【机器学习】机器学习中用到的高等数学知识-8. 图论 (Graph Theory)
人工智能·机器学习·图论
Matlab精灵7 小时前
Matlab函数中的隐马尔可夫模型
开发语言·matlab·统计学习
Microsoft Word7 小时前
c++基础语法
开发语言·c++·算法
曼城周杰伦7 小时前
自然语言处理:第六十三章 阿里Qwen2 & 2.5系列
人工智能·阿里云·语言模型·自然语言处理·chatgpt·nlp·gpt-3