优化的局部定向韦伯图样与更快的区域卷积神经网络的集成，以增强医学图像检索和分类能力

论文总结

提出新的医学图像检索与分类框架

结合改进的图像模式描述符（OLDPW）与深度学习模型（改进的Faster-RCNN），用于提升医学图像的检索和分类性能。
设计新的图像特征描述符：OLDPW

提出"优化局部方向韦伯模式"（Optimized Local Directional Weber Pattern, OLDPW），融合了：
- 局部方向模式（LDP）
- 局部韦伯模式（LWP，包含均匀LBP和差分激励分量）
  
  通过优化算法为每个像素选择最优特征分量，生成更具判别力的特征。
提出多目标相似度函数

在图像检索中，使用包含以下四个指标的相似度函数：
- 结构相似性指数（SSIM）
- 峰值信噪比（PSNR）
- 均方误差（MSE）
- 相关系数（CORR）
改进Faster-RCNN用于分类

对Faster-RCNN进行优化，使用提出的MWS-DHOA算法来调整：
- 隐藏神经元数量
- 训练轮数（epoch）
  
  目标是最大化分类准确率。
提出改进的优化算法：MWS-DHOA

在传统"鹿群狩猎优化算法"（DHOA）基础上，引入基于风速的改进策略，动态调整搜索行为，提升收敛速度、避免早熟收敛、降低时间复杂度。
统一优化目标
- 检索阶段：最大化图像间的互信息（Mutual Information）
- 分类阶段：最大化分类准确率
实验验证
- 使用多个公开医学图像数据集（CT、MRI、X-ray、乳腺图、眼底图等）
- 对比多种传统特征描述符（LBP、LAP、LGP、LDP、LWP等）
- 对比多种优化算法（DHOA、J-BMO、JA、BMO等）
- 对比多种分类器（RNN、KNN、NN、CNN、FRCNN等）
- 实验结果表明，提出的方法在F1分数、精确率、准确率等多个指标上优于现有方法

摘要

随着医院数字影像数据的广泛应用，医学影像存储库的规模正以极快的速度增长。这导致查询和管理庞大数据库变得困难，进而导致了内容基于医学影像检索（CBMIR）系统的必要需求。CBMIR被认为是减少信息量较多数据集中人工查询与图像语义差距的主要模糊且具有挑战性的任务。本文的主要目的是利用改进的模式描述符和深度学习，提升医学图像的检索和分类能力。对于医学图像检索，本文开发了带有多目标相似函数的优化局部定向韦伯模式。该相似度函数关注结构相似指数测度、峰值信噪比、均方误差MSE和相关性等指标。同样，分类阶段采用了改进的快速区域卷积神经网络（Faster-RCNN）的开发。基于修改风速的鹿狩猎优化算法进一步提升了检索和分类能力。结合分类和检索任务，基准数据集上的实验揭示了相比现有方法，这是对引入算法的改进。

引言

影像是临床医学的基本组成部分，主要用于患者反应评估、治疗计划、护理和诊断。图像相似性概念具有重要的医学意义。这是因为诊断决策基于从患者处收集的信息的历史使用，这些信息可能是非图像或图像。2,3 如今，数字图像的使用似乎在教育、科学和医疗等多个领域都很常见。4 医疗机构和医院作为其日常工作的一部分，如磁共振成像（MRI），产生大量医学图像，乳腺X光和X光。对于医学图像解读来说，这是一项需要大量知识的艰巨任务。5 内容基于医学图像检索（CBMIR）是基于内容的图像检索（CBIR）的一部分，它利用了CBIR技术中各种技术的不同增强和优势。6 CBMIR是一种传统的图像检索系统，利用视觉特征（如颜色）进行图像检索。质地和形状。CBMIR系统面临的主要挑战是高层语义信息与低层视觉信息之间的语义鸿沟。任何MIR技术的主要思想由两个主要阶段或步骤组成，比如计算称为在线阶段的相似度度量和称为离线阶段的特征提取。通过调查图像内容，可以找到相同的图像。特征描述符匹配描述了匹配的两张图像。7 因此，相似度测度和图像表示被假定为关键。最初，采用强度直方图特征来检索医学图像。8--10 然而，由于描述符的区分力较弱，它们在大型数据库中的检索性能主要有所下降。传统问题通过提出基于纹理的特征来检索医学图像来解决。局部二元模式（LBP）在计算复杂度较低和医学应用中，对纹理分类产生了更好的影响。此外，还获得了LBP变体，如数据驱动LBP、中心对称局部三元模式、中心对称LBP（CSLBP）和局部三元模式（LTP）。其余纹理描述符基于所给参考像素的邻居关系与图像中中心像素与邻居像素的关系。局部位平面解码模式（LBDP）是通过基于中心像素强度值的差来生成二进制模式生成的。12 这些现有人工技术的主要局限在于性能较差，因为高级语义信息并未通过用户脑中的视觉特征来描述。13 如今，随着深度学习的快速发展，预训练卷积神经网络（CNN）方法所获得的特性14获得了更高的灵活性，在图像检索的通用任务（如对象识别或图像检索）中，性能优于现有描述符。这些特征信息由丰富的图像语义信息组成，是提升图像检索准确性所必需的。15,16 此外，CNN技术提取特征时，还会被用于医学图像的检索。17 然而，CNN方法中的特征提取大多被认为是高维的，降低了检索效果，同时也提高了计算成本。18 医学图像可以非常快速地从庞大的数据集中检索。高维特征通过哈希导向技术处理到低维空间，生成紧致二进制码用于连接CNN方法。19 本文的贡献如下。

• 利用改进型模式描述符和深度学习，通过考虑数据集，开发增强型医学图像检索和分类模型。

• 开发一种新颖的OLDWP描述符，即局部导数模式（LDP）和局部小波模式（LWP）的组合，用于检索医学图像。

• 提出一种增强型的快速区域卷积神经网络（FRCNN），用于分类医学图像，以最小化计算复杂度，从而优化时代数和隐藏神经元数。

• 引入一种新型改良优化算法，称为MWS-DHOA，以降低收敛率和时间复杂度。

论文的组织如下。第一部分解释了关于医学图像检索的介绍。与医学图像检索相关的文献作品见第二节。第3节解释了使用所提模式描述符进行医学图像检索，随后进行深度医学图像分类。多目标相似函数的OLDWP在第4节中进行了解释。第五节讨论了改进的FRCNN用于医学图像分类。第6节描述了结果和讨论。第七节为论文的结尾。

文献综述

数字技术在医学科学中发挥着至关重要的作用。通过增强生物医学传感器和高通量图像采集技术，医学影像模式得到了快速改进。这些设备能生成大量异构医学图像，在疾病分析和治疗中发挥重要作用。从大量医学影像中，医学专家可以通过检索相关病例，将过去的同一情况与之关联起来。在机器学习和人工智能算法出现之前，探索庞大的多模态数据库以获得任何困难问题的帮助被认为是一项繁琐的任务。因此，发展高效的MIRS系统以支持医疗专家，从而改善诊断和治疗非常重要。2015年，Dubey等人提出了一种基于局部小波图案（LWP）的新型图像特征描述，用于表征医学计算机断层扫描（CT）图像，用于检索面向内容的CT图像。LWP是通过对每个与中心像素关系的像素使用邻近的局部信息推导出来的。最初，该技术通过局部小波分解利用邻近像素之间的关系。最后一步，考虑了与中心像素的关系。通过采用中心像素变换策略，中心值范围与局部小波分解值范围匹配。该性能通过三个CT图像数据库测试，涉及回忆性和精度。还与多种现有局部图像描述符进行了比较，实验结果显示，引入的技术优于其他CT图像检索技术。2020年，Ahmed和Malebary21引入了两种扩展技术，以提高反演方法的精度。这些技术基于排名最高的图像。最初，小说扩展查询图像基于排名最高的图像特征的平均值进行了重新表述。下一种技术依赖于显著特征选择。扩展技术基于从PH2和Kvasir等两个熟悉的医学图像数据集中提取的12个纹理特征和18个颜色特征。实验结果在两个数据集中均显示更高精度。2019年，蔡等人提出了一种结合哈希编码和CNN的新型CBMIR框架。新框架采用了暹罗网络，将图像对作为输入。一个模型利用对比减重和重量共享函数，使图像具有类似类的特征。在网络的每个分支中，卷积神经网络提取特征，哈希映射最小化特征向量维度。该测试在两个医学图像数据集上进行：视觉与图像分析组/国际早期肺癌行动计划（VIA/I-ELCAP）和癌症影像档案-计算机断层扫描。结果显示该技术优于CNN技术和传统哈希技术。与现有哈希技术区分后，面向特征提取的CNN带来了多项好处。建议的将哈希技术与暹罗网络结合的算法优于现有的面向CNN的技术。使用新颖的损失函数可以有效提高检索的准确性。2015年，Dubey等人描述了基于局部对角极值模式（LDEP）用于检索CT图像的有用且新颖的图像特征描述符。它通过一阶局部对角导数，找到了局部对角极值的指标和值，以利用对角邻居之间的关系。对角邻居最小化了特征向量维数，从而加快图像检索的过程，并解决了"维度诅咒"问题。该方法通过NEMA-CT和肺气质CT数据库验证，并与传统技术进行区分。通过实验验证了加速效果和性能的提升。2014年，Murala和Wu24借助LMeP开发了一种新颖的检索和图像索引算法，用于检索生物医学图像。LBP编码了周围邻居与被参考像素之间的关系，而开发的技术则将其编码在周围邻居之间，针对所提供参考像素。适用的关系基于邻居计数。本数据库如VIA/I-ELCAP、NEMA-CT和OASIS-MRI数据库，均由感兴趣区域的CT图像组成。结果显示其评估指标相较于变换域、空间域、带有Gabor变换的LBP和LBP技术有显著提升。2016年，Dubey等人提出了基于LBDP的新图像特征描述符，用于检索和索引生物医学图像。局部位面变换策略测量了每个图像像素的局部位元变换值。然后，利用中心像素强度差值与局部位面变换值的二元图样，生成了建议的LBDP。使用了三个基准数据库，如开放获取影像研究系列MRI、NEMA-CT和肺气肿CT。实验结果描述了建议的LBDP在检索和索引生物医学图像方面的有效性和判别能力，并证明了传统生物医学图像检索技术的特性。2019年，Swati等人提出了一种自动CBIR系统，用于T1加权增强MRI的脑肿瘤。这里的关键挑战在于通过人类评估员描述的高级信息和通过MRI机器传输的低层次视觉信息。当时的提取技术只集中在高层或低层的地貌，几乎没有采用手工制作的特征来减少这一差距。因此，引入了基于Deep CNN VGG19的新特征提取框架，并采用闭式度量学习计算数据库与查询图像之间的相似性。这种技术非常通用，手工制作的功能在这里没有被使用。需要最小的预处理，并在五重交叉验证中被验证为稳健，实现了平均精度，优于传统CBIR系统。2017年，Qayyum等人利用训练的深度CNN为CBMIR系统构建了一个深度学习框架，用于医学图像分类。该网络使用多模态数据集进行训练。分类结果以及学习到的特征都检索了医学图像。采用以阶级为导向的预测结果更佳。任务检索获得了平均平均精度和平均分类精度。它最适合用于多模态医学图像检索，以获取不同器官。表1展示了传统医学图像检索方法的一些特点和挑战。2020年，Ershad等人提出了一种基于改进局部三元模式（ILTP）的高准确度树皮纹理分类方法29。在该拟议的ILTP中，三元模式被编码为两个二元模式，然后每个模式被分为两个均匀或非均匀组。提取的图案根据均匀程度进行了标记。最后，标签的出现概率被提取为特征。此外，设计了一个多层感知器，包含隐藏节点数量的四种理论。对两个基准数据集的实验结果显示，该方法的分类准确率高于大多数知名方法。2021年，Ershad 等人提出了一个名为多阈值均匀局部三元模式（MT-ULTP）的局部纹理分析描述符。它提取了不同位置层级的局部显著纹理信息。局部三元模式在不同阈值中被提取，最后，将均匀模式的出现概率作为特征提取出来。MT-ULTP 巧妙结合了 LTP 和多层局部二进制模式，在特征提取和局部模式选择方面具有新颖性。结果表明，基于多种阈值组合的均匀提取模式比局部三元模式中的简单形式效果更好。2021年，Ghosh等人提出了基于纹理的特征描述符，随后提出了一种用于基于区域文本非文本分类的新颖特征选择技术。该模型结合了旋转不变性质与局部三元模式，形成了一个新的基于纹理的特征描述符------旋转不变局部三元模式。随后，提出了一种新颖的特征选择技术，采用了二元粒子群优化的修改版本。比较研究显示该方法的鲁棒性和强大性，其数量超过了许多最先进的纹理相关功能。表1展示了各种现有医学图像检索方法的特点和挑战。

使用拟议的模式描述符进行医学图像检索，随后进行深度医学图像分类

用于分析的医学图像描述

该数据库由"CT（Kaggle）、CT头部（Kaggle）、虹膜底（DIARETDB1）、乳腺乳腺摄影（MIAS）、脑MRI（Kaggle）、超声波（Kaggle）、X光骨（Kaggle）、X光、胸部（Kaggle）和X光牙科（Kaggle）"收集的图像组成。它包含1100多张图片，并再次分为九个文件夹。每个文件夹由九张查询图像组成，用于分类和数据检索。因此，该数据库更适合CBMIR相关的研究。数据库中每个类别的样本图片如图1所示，提供了少量示例图片。

拟议模型的架构描述

计算机导向的医学图像分析方法支持技术人员和医疗专家，基于计算机系统提供的关键输入，提升疾病诊断能力。医学图像检索32,33被认为是健康和医学信息学中最具挑战性和首要的问题。在图像检索的情况下，基于数据库与查询图像的内容相似度，考虑数据库与查询图像之间的内容相似度，考虑最佳图像匹配及描述符。一些流行的LBP变体包括"局部三元模式（LTP）、局部导数模式（LDP）、局部梯度六面模式（LGHP）、局部方向梯度模式（LDGP）和局部定向序模式（LDOP）"，用于检索和识别。"局部四元图（LTrP）和多通道解码LBP（mdLBP）"用于检索图像。"局部强度顺序模式（LIOP）和交错强度顺序本地描述符（IOLD）"用于局部图像匹配。"完整双交叉图案（CDCP）、局部方向之字形图案（LDZP）和局部喷射图案（LJP）"用于分类纹理。最近在获取医学图像时，LBP变体描述符的一些改进包括："局部网格模式（LMeP）、局部三元共现模式（LTCoP）、局部对角极值模式（LDEP）、局部位面DIS相似模式（LBDISP）、LBDP和LWP。在某些情况下，医学图像34是利用压缩散射系数来恢复的。位平面解码导向描述符非常适合检索医学图像。所提医学图像检索模型的架构如图2所示。增强型医学图像检索与分类的架构包括两个主要过程，即"医学图像检索与分类"。在图像检索的初始步骤中，从医学图像中提取一种称为OLDWP的新模式。建议的OLDWP形态是LDP和LWP形态的结合。引入的MWS-DHOA用于最佳模式选择。一旦查询图像进入图像检索系统，OLDWP模式会从数据库和查询图像中提取出来。检索系统识别训练过程中每张图像的OLDWP。同样，测试图像的OLDWP在测试过程中被识别，并执行多目标相似函数以匹配相同的图像内容。检索过程重点为最大化检索图像的互信息。改进后的FR-CNN被用于基于拟议MWS-DHOA的分类过程。这里，建议的MWS-DHOA通过优化过程调校适用于图像分类的纪元数量及隐藏神经元，并考虑了最大分类准确性。改进后的FR-CNN与测试图像的OLDWP一起处理，并识别类别信息。

采用MULT I- 目标S的微度函数优化局部定向韦伯图案

新的OLDWP图像检索模式描述符

局部方向模式

局部方向图（LDP）35利用像素周围某一方向梯度大小的变化来编码其局部纹理。它不是区分邻近像素的强度，而是区分邻近像素的梯度大小。通过对特定像素的边缘响应值在八个不同方向上进行微分，分配给输入图像的每个像素。因此，测量每个像素在八种不同方向下的八个方向性边缘响应值。使用以像素为中心的Kirsch遮罩（掩码M0--掩模M7）。OLDWP的半径大小为1，邻域大小为3 × 3。与LBP相同，邻域大小大多扩展为不同尺寸，以适应特定纹理类型的代表性特征。当这些掩码应用于像素时，会得到其边缘响应值（m0 − m7），每个值描述了八个方向边缘的重要性。响应值在整个方向上并不相等。边缘或角点的可用性在特定方向上产生了高响应值。LDP是通过描述kb最显著的方向来生成的。因此，顶部的kb值被置为1，其余的（8−kb）位被置为0。方程（1）定义了LDP码。

局部韦伯模式

局部韦伯图案（LWP）36连接图像的LBP和韦伯图案。为了识别图像中存在的LWP图样，除了从图像中提取LBP外，还需要进行差分激励。利用LBP和与差分激发相关的直方图计算，可以识别LWP。LWP的运作基于韦伯定律。根据韦伯定律，在较小噪声环境中出现的低声波穿透率比噪声大环境中的高声更为明显。因此，图像中的LWP估计是利用LBP和微分激励计算的。

微分激励计算

测试查询图像HAia用于评估，其中心像素由PACA定义。接下来，测量差动激γ（paca），如下文步骤所示。

图像中每个像素从中心像素HAia的强度变化定义如下方程（3）。

在上述方程中，项ΔIna定义了邻近像素paea和中心像素paca之间发生的强度变化。与中心像素相关的韦伯比值如公式（4）所示测量。

因此，对于中心像素的微分激发计算，会对韦伯比值施加一个弧切函数。弧切函数高效地减少了像素中的噪声元素。因此，与中心像素相关的微分激励如式（5）所示。

这里，微分激发值位于 $-π 2， π 2$ 的范围内。如果微分激发γ（paca）出现正值，则假设靠近当前像素的邻居像素较轻，另一个值则相反。在LWP直方图构建中，微分激发被分为多个部分。在考虑少数情况下，强度差以与二阶导数相关的拉普拉斯算子来测量。为此，强度差用高斯算符拉普拉斯算子（LoG）描述，由ΔGA2给出。接着，基于LoG对像素的微分激发进行变化，如方程（7）所示。

LBP结构

LBP是通过通过一个阈值生成与像素相关的二进制数来构造的。接下来，将每个邻像素的二进制码转换为直方图，生成与图像关联的LBP码。图像中每个邻像素的 LBP 由方程（8）给出。

在上述方程中，fa（qa）区间的值定义如下方程（9）。

一旦以中心像素为准考虑邻近像素的二进制值，便描述了LBP码。LWP模式是通过考虑均匀LBP来实现的，从而避免噪声变体。均匀LBP是从2ea值的子集中考虑的，由LBPue2给出。

LWP描述符的构造

它由均匀LBP和微分激励分量共同构成。直方图表示用于更简单的描述子表示。在第一步中，测量每个像素对应的均匀 LBP。接下来，基于方程（5）测量与每个邻像素关联的微分激发。随后，定义大小为AA×BA的二维（二维）直方图的微分激发和LBP描述符。这里，差分激发中的区间计数由BA给出，总LBP计数分别由AA给出。因此，在二维直方图的情况下，行定义了微分激发，列定义了LBP模式。因此，为图像HAia构造的LWP分别由HALWP ia表示。

拟议中的OLDWP

一旦识别出LWP和LDP模式，便用于生成拟议的OLDWP。图像获得的LWP模式由均匀LBP和微分激发组成。计算出来的LDP由高效的局部变体表示组成。为了构建OLDWP，建议的MWS-DHOA在描述符的任意三个分量（如LDP、均匀LBP和微分激励）中最优地选择模式描述符。引入的OLDWP最优地为新生成的OLDWP的每个像素选择三种描述符中的一种。开发的OLDWP结构中包含的过程图示于图3。这张图清楚地解释了关于引入OLDWP创建的描述。假设要生成的OLDWP模式由PA∗QA的大小组成。因此，OLDWP中存在的每个像素xana都执行优化过程。此外，每个像素考虑的值范围为DA = $1， 2， 3$ 。如果优化考虑DA = 1，则考虑微分激励;当DA = 2时，考虑LWP的均匀LBP分量。在最后一步，当DA = 3时，假设LDP用于创建推荐的OLDWP。步骤的重复进行，直到用最优特征描述符识别出OLDWP的每个像素。在最后一步，新构造描述子图像执行直方图过程以获得最终的OLDWP描述符。在创建建议的OLDWP描述符时，引入的MWS-DHOA意图将互信息最大化作为适应度函数。这反过来使得小说OLDWP描述更适合用于检索图像。因此，术语 HAOLDWP ia 被视为 OLDWP 图像。256×256个特征可以通过提出的OLDWP模型提取。

图3：提出的优化局部方向韦伯图样用于图像检索

多目标相似函数

一旦确定了开发好的OLDWP描述符，就可以执行图像检索任务。图像检索的过程通过计算图像之间的相似性来完成。这里，图像检索采用了多目标相似函数。OLDWP训练集图像与查询OLDWP图像之间多目标相似函数的数学描述清晰可见于方程（10）。

在上述方程中，MOSF表示多目标相似函数，MSE表示均方误差，SSIM表示结构相似度指数，PSNR表示峰值信噪比，CORR分别表示查询与原始图像之间的相关性。MSE的定义是"衡量误差的平方平均值，即训练集的OLDWP图像与查询的OLDWP图像之间的平均平方差"。如式（11）所示。

这里，图像中的总像素数由 NE 给出，训练图像的 OLDWP 由 HAOLDWP（train） ia 给出，查询图像的 OLDWP 由 HAOLDWP（query） ia 给出。

SSIM被定义为"预测感知质量的方法，用于测量两张图像之间的相似性"，如方程（12）所示。

在上述方程中，HAOLDWP（train） ia 和 HAOLDWP（query） ia 的方差分别由 σ² HAOLDWP（train） ia 和 σ² HAOLDWP（query） ia 给出。常数由 CNA1 和 CNA2 给出，HAOLDWP（train） ia 的平均值由 μHAOLDWP（train） ia 给出，HAOLDWP（query） ia 的平均值由 μHAOLDWP（query） ia 给出，项 σHAOLDWP（train） ia 表示 HAOLDWP（train）的协方差 ia 和 HAOLDWP（query） ia ，PSNR定义为"两幅图像最大可能功率的比值"，如方程（13）所示。

这里，与图像相关的最大像素值分别由MAXia给出。训练图像与查询图像之间的相关性见方程（14）。

引入的图像检索系统由训练阶段和测试阶段两个阶段组成。在训练过程中，数据库中每张图像的OLDWP描述符都会被识别，并生成特征库。在测试过程中，一旦查询图像进入图像检索过程，就会计算与查询图像相关的OLDWP描述符。然后，测量特征库中存在的图像和查询图像之间的多目标相似函数。基于查询图像与特征库之间获得的值，图像检索得以完成。因此，引入的图像检索系统考虑图像与查询图像的相似度较低。这里收集含有不同医学图像的数据库，供评估过程使用。因此，引入的检索系统会考虑与该域相关的每个查询的相关图像

OLDWP模式的目标函数

为了开发图像检索系统，必须满足一个重要的条件------互信息。因此，当选择引入的多目标相似函数的OLDWP的最优描述子时，目标模型将互信息最大化作为适应度目标。与生成建议OLDWP相关的适应度目标见方程（15）。

在上述方程中，MIC一词定义了互信息，其推导如下。互信息33用于识别任意两张图像中相同的信息内容。在这里，查询与数据库中其他图像之间的互信息被估计，以识别MIC值。公式（16）显示了MIC在查询及剩余图像中的表达式。

在上述方程中，术语 HAOLDWP ia 定义了 OLDWP 变换后的图像，Shanon 熵由 SC（定义），原始图像分别由 HAia 给出

拟议中的MWS-DHOA

所提出的MWS-DHOA用于增强图案提取阶段以及图像分类阶段。它优化了模式提取阶段的LWP和LDP描述符，以最大化互信息和纪元数，同时优化图像分类阶段FRCNN的隐藏神经元，以最大化分类准确性。DHOA37的灵感来源于人类朝鹿方向狩猎的表现。利用猎人的狩猎方式，鹿遭到攻击。这种方法依赖于猎人在被视为继承者和领袖的最佳位置的移动。在鹿到达之前，每个猎人的位置都会被更新。第一步从方程（17）中定义的猎人种群初始化开始。

在上述方程中，猎人总数由被视为总种群STD解的ndmd给出。由于假设搜索空间是一个圆，圆的周长后跟风角，如方程（18）所示。

这里，随机数由rddd给出，当前时刻的迭代分别由kd给出。与鹿相关的位置角见方程（19）。

在上述方程中，θ 定义了风角。这里考虑的两个职位是领导者和继任者职位。领头位置由STDldrd表示，被认为是猎人的第一个最优位置。猎人的继任位置由STDsuccd决定。环绕性能如方程（20）所示。

在上述方程中，下一次迭代的位置由STDkd+1给出，系数向量由LVD和XVD给出，随机数由prd给出，位置为当前迭代由STDkd给出。系数向量在方程（21）和（22）中明确给出。

这里，参数由bpd给出，随机数由crd给出，最大迭代由kdmax表示。猎人的位置由角度决定，攻击是猎物不预期的，因此狩猎技巧更有效。与鹿相关的视角见方程（23）。

在上述方程中，与搜索代理相关的后继位置由STDsuccd给出。每次迭代时，搜索代理的位置会根据获得的最优解而更新。传统的DHOA有多个优点，比如可以采用多种优化原则，在工程问题处理上非常高效，实现更好的分类精度等。但它也受到一些限制，比如收敛提前、无法获得局部最优解等。这些不足通过在风速基础上修改算法（MWS-DHOA）得以克服。该MWS-DHOA既实现了全局最优解，也实现局部最优解，避免过早收敛，并返回更低的时间复杂度等。在传统的DHOA中，风速prd被视为介于0到2之间的随机数。但在拟议的MWS-DHOA中，风速基于以下两个条件确定。在第一种条件下，如果kd == 0，则风速基于方程（28）确定。

这里，rnd 表示随机数，md1 和 md2 的值分别为 0 和 2。否则，如果kd≠0，则风速基于方程（29）确定。

在上述方程中，Fitc表示当前适应度，Fitd表示前一次迭代的适应度。拟议的MWS-DHOA伪代码见算法1。修改后的优化算法带来了若干好处，如提升整体性能、最小化计算工作量、为评估过程提供适当方向等。34 它还为整个过程返回新信息，提升与高维问题相关的性能，并根据条件自适应调整总体规模，等等。

改进的FASTER-RCNN用于医学图像分类

FRCNN

该FRCNN39旨在解决快速RCNN的局限性，例如区域提案成为实时需求的瓶颈。它采用了一个深度且全卷积的网络，称为区域提案网络（RPN），用于提出区域。因此，快速RCNN利用这些区域进行物体检测。Fast RCNN和RPN共享这些功能，这有助于提升准确性。因此，FRCNN提供了多种优势，研究人员也在不断完善和开发该技术。

改进的基于FRCNN的分类

改进后的FRCNN被用于通过MWS-DHOA优化隐藏神经元和纪元数，以最大化图像的准确性。FRCNN提供了多项优势，如对整个网络进行微调、合理参数的查找等。但它存在一些限制，比如实时需求的区域提案、权重更新和训练过程的复杂性等。因此，这些限制通过优化隐藏神经元和历元数来解决，采用相同的MWS-DHOA，称为改进版FRCNN。图像分类阶段的 Froch 数量以及 FRCNN 隐藏神经元的数量最大化了分类准确性。这种改进的FRCNN带来了多项优势，如提高准确性、更易权重更新、降低计算复杂度等。这里，纪元数的边界限制在1到5之间，隐藏神经元的边界限制在5到50之间。因此，目标可以像方程（30）中那样建模。

在上述方程中，分类阶段的目标由Fitd给出，FRCNN的隐藏神经元由HEFRCNN给出，FRCNN的纪元数由NEFRCNN给出，分类精度由Acy表示。准确性定义为"已知结果与基值的差异"，如方程（31）所示

这里，TPS、TNS、FPS 和 FNS 分别定义了"真阳性、真阴性、假阳性和假阴性"。改进后的基于FRCNN的分类图示如图4所示。

图4：改进的基于快速区域卷积神经网络的分类

结果与讨论

实验配置

对引入的医学图像检索系统的完整评估用Python完成，实验则通过收集不同数据集进行。实验重复了25次，总人口为10。OLDWP图像检索方案通过公共数据库执行图像检索任务，其性能通过不同的描述符区分，如LBP、40局部各向异性模式（LAP）、41局部梯度模式（LGP）、42 LDP、35和LWP36。此外，用于优化OLDWP的MWS-DHOA性能也与近期启发式如BMO-OLDWP，43，JA-OLDWP，44，J-BMO-OLDWP，45和DHOA-OLDWP，37进行了区分。除了这些比较方法外，还选用了少数机器学习工具，如Recurrent Neural Network RNN、32 KNN、46 NN、47 CN、48 FRCNN、39 HRNH、49 Deep Residual CNN、50和DCNN51，用于对建议OLDWP+FRCNN分类器的表现进行比较评估。

性能指标

为了评估引入的图像检索和分类阶段，以下评估指标被纳入考量。

（a）净现值（NPV）："它表示来自检索系统的直接虚假值。"

（b）灵敏度："指在各图像中正确识别的检索数据。"

（c）伪发现率（FDR）："指阳性值内的总假阳性"

（d） Matthews 相关系数（MCC）："它是响应参数之间的相关系数。"

（e）准确性：在方程（31）中清晰表现。

（f）精度："它是数据检索与原始数据偏差的衡量标准。"

（g）假阴性率（FNR）："指在正值内的负性反应率。"

（h） F1 评分："它是灵敏度与特异性之间的平均值。"

（i）假阳性率（FPR）："指负性输出中总的阳性结果"。

（j）具体性："它表示在数据检索过程中错误数据被正确忽视的比例"

实验结果

建议图像检索方法的实验结果如下描述。现有的LAP、LBP、LDP、LGP、LWP及拟议的OLDWP检索的图像分别见图5、图6、图7、图8、图9和图10。这里，结果代表基于分析查询检索到的图像。给出了建议图像检索系统对传统作品的回应。与最先进的优化算法相比，MWS-DHOA提供了具有竞争力的结果。这种方法非常简单且成本低廉。当使用传统技术检索医学图像时，这些方法导致检索准确性较低。但图12中提出的OLDWP返回的检索性能优于最先进的方案。

对拟议图像检索系统的F1分数分析，针对启发式算法

图11清楚地展示了引入图像检索系统的F1分数与最先进启发式的分析。根据图11A，查询1中，MWS-DHOA-OLDWP 在考虑20张检索图像时的F1分数分别高出DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP、BMO-OLDWP 75%、87.5%、50%和56.25%。以图11B为例，对于检索到的10张图像，查询2中，MWS-DHOA-OLDWP 的 F1 得分分别比 DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP 和 BMO-OLDWP 提升了 63.64%、61.11%、38.46% 和 50%。在图11C中，考虑20张检索图像，查询3中，MWS-DHOA-OLDWP 的 F1 得分分别为 58.82%、41.67% 和 58.82%，超过了 DHOA-OLDWP、JA-OLDWP 和 BMO-OLDWP。因此，很明显，MWS-DHOA-OLDWP 的 F1 评分分析优于现有的启发式医疗图像检索方法。

对拟议图像检索系统的启发式系统进行精确分析

图12展示了基于五张查询图像对传统启发式的MWS-DHOA-OLDWP的精确分析。根据图12C，查询3中，MWS-DHOA-OLDWP 对 60 张检索图像的精度分别为 DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP 和 BMO-OLDWP 的 12.5%、20%、17.39% 和 28.57%。在图12D中，查询4中，MWS-DHOA-OLDWP 对90张检索图像的精度分别为 DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP 和 BMO-OLDWP 的 3.23%、10.34%、16.36% 和 23.08%。在图12E中，查询5中，MWS-DHOA-OLDWP 对 40 张检索图像的精度分别提升为 DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP 和 BMO-OLDWP 的 1.37%、5.71%、10.45% 和 17.46%。根据图12E中查询5的结果分析，MWS-DHOA-OLDWP 模型在所有检索图像中与 DHOA-OLDWP 模型的性能相当。因此，很明显，MWS-DHOA-OLDWP 在五张查询图像的精度上优于其他现有的医学图像检索启发式技术。

对拟议图像检索系统的F1评分分析，针对特征模式

图13展示了MWS-DHOA-OLDWP与现有特征描述符的F1分数分析。根据图13C，查询3中，MWS-DHOA-OLDWP 对80张检索图像的F1分数分别为77.75%、17.76%、17.76%、83.33和17.75%，均优于LBP、LAP、LGP和ldp。在考虑图13D时，对于查询4，F1分数MWS-DHOA-OLDWP 在 40 张检索图像中，分别高于 LBP、LAP、LGP 和 66.66%，分别高于 LBP、LAP、LGP 和 LWP。在图13E中，查询5中，MWS-DHOA-OLDWP 在检索30张图像时的F1分数分别为88.23%、64.70%、61.76%、63.52和58.82%，优于LBP、LAP、LGP和ldp。因此，结合特征模式分析F1评分比其他检索医学图像的方法更适合MWS-DHOA-OLDWP。

对拟议图像检索系统的特征描述符进行精确分析

图14清晰地展示了MWS-DHOA-OLDWP的精确分析以及现有医学图像检索特征描述符的五张查询图像。根据图14A，查询1中，MWS-DHOA-OLDWP 对70张检索图像的精度分别比LBP、LAP、LGP和LWP高出22.22%、19.44%、16.66%、5.55%和44.44%。以图14B为例，查询2中，MWS-DHOA-OLDWP 对50张检索图像的精度分别提升为25%、12.5%、12.6%、2.08和10.41%，优于LBP、LAP、LGP和LDP。在图14C中，对于查询3，对于20张检索图像，MWS-DHOA-OLDWP的精度分别比LBP、LAP、LGP和LDP先进14.28%、23.2%、12.5%、17.85%和5.35%。因此，五张查询图像时，MWS-DHOA-OLDWP 的精确分析优于现有的图像检索特征描述符。

通过不同学习百分比对启发式方法的检索性能

MWS-DHOA-OLDWP 的检索性能及现有启发式方法如图15所示。从图15A来看，MWS-DHOA-OLDWP 的学习率为 65%，分别比 DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP 和 BMO-OLDWP 高出 1.98%、1.45%、2.84% 和 2.73%。在图15B中，MWS-DHOA-OLDWP 在45%学习率下的精度分别比DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP 和 BMO-OLDWP 高出79%。在图15C中，MWS-DHOA-OLDWP 的 F1 成绩分别比 DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP 和 BMO-OLDWP 高出 1.02%、1.33%、0.96% 和 1.18%。因此，MWS-DHOA-OLDWP 的检索性能优于其他医学图像分类启发式。

分类性能相较于现有分类器

图16展示了MWS-DHOA-OLDWP+FRCNN的分类分析及现有医学图像检索分类算法。分类准确性是我们的出发点。它是正确预测数与预测总数的比值。通常，预测模型的准确率较高（准确率超过90%），因此通常用模型的错误率来总结模型的表现。分类准确性是分类模型中用于预测测试数据集中每个样本的主要指标。以图16A为例，MWS-DHOA-OLDWP+FRCNN在65%学习率下的准确率分别为12.64%、13.95%、11.36%、18.07%和15.29%，均优于FRCNN、CNN、NN、KNN和RNN。从图16B中，MWS-DHOA-OLDWP+FRCNN在55%学习率下的精度分别提升为2.06%、3.13%、5.32%、1.02%和4.21%，分别优于FRCNN、CNN、NN、KNN和RNN。图16C中，MWS-DHOA-OLDWP+FRCNN在35%学习率下的F1得分分别为4.17%、5.26%、6.38%、3.09%，比FRCNN、CNN、NN、KNN和RNN高出2.04%。因此，MWS-DHOA-OLDWP+FRCNN的分类分析结果优于其他医学图像分类方法。

拟议医学影像检索与分类系统的总体分析

MWS-DHOA-OLDWP 的整体算法分析、分类分析、现有启发式算法以及用于检索和分类医学图像的机器学习算法分别列于表 2 和表 3。从表2中，MWS-DHOA-OLDWP 的准确率分别比DHOA-OLDWP、J-BMO-OLDWP、JA-OLDWP 和 BMO-OLDWP 高出0.52%、0.31%、0.72%和0.31%。此外，表3中MWS-DHOA-OLDWP+FRCNN的准确率分别为7.87%、9.20%、9.20%、9.94%和9.08%，均高于FRCNN、CNN、NN、KNN和RNN的9.08%。在观察表2和表3时，所提出的MWS-DHOA-OLDWP模型在FNR方面比其他传统算法有所降低。同样地，精度也高于其他算法。因此，在算法分析中观察到，MCC与传统算法相比比位变异较小，但在分类器分析中，所提出的MWS-DHOA-OLDWP模型中的MCC值优于其他传统算法。因此，无论是算法分析还是分类分析，MWS-DHOA-OLDWP+FRCNN的结果优于其他现有启发式和机器学习算法用于检索和分类医学图像。

与现有方法的比较分析

图17展示了对拟议图像检索系统现有方法与现有方法的比较分析。图17A中，拟议的MWS-DHOA-OLDWP+FRCNN在学习率45时的准确率分别比HRNH、DR-CNN和DCNN高出4.38%、5.07%和3.69%。因此，所提议的MWS-DHOA-OLDWP+FRCNN表现优于所有其他现有方法。

总结

本论文通过改进的模式描述符和深度学习，提升了医学图像检索和分类能力。为了检索医学图像，OLDWP开发了多目标相似函数，考虑了SSIM、PSNR、MSE和相关性等指标。此外，改进版FRCNN的开发也被应用于分类阶段。利用新颖的MWS-DHOA技术改进了反演和分类阶段。通过与传统技术在不同度量上的比较来描述表演。分析显示，基于MWS-DHOA-OLDWP的检索准确率分别高出DHOA-OLDWP J-BMO-OLDWP、JA-OLDWP、0.31%和0.31%。同样，基于MWS-DHOA-OLDWP（美国国家福音书）的FR-RCNN准确率分别为7.87%、9.20%、9.20%、9.94%和9.08%的先进，均高于FRCNN、CNN、NN、KNN和RNN。因此，很明显，提出的MWS-DHOA-OLDWP在检索和分类医学图像时，采用传统启发式、模式描述符和分类算法，结果更优。未来，该模型可用于高效的图像描述符，如MT-ULTP和局部邻域差分模式（LNDP），以及智能技术和集成学习方法被纳入，以获得更好的医学图像检索和分类结果。