仿人脑抑制机制的图像识别网络抗全域异常激活算法研究

------------------------------作者：杨连江

摘要

针对马赛克、随机噪点、模糊图像等分布外输入引发卷积神经网络（CNN）全域神经元异常高激活、特征表达紊乱、识别精度骤降的问题，本文借鉴人脑视觉系统瞬时响应、侧抑制、全局噪声判别、注意力筛选、神经稳态约束的多级调控机理，提出一种仿生抑制算法框架。该框架由噪声判别模块、激活稳态约束模块、局部侧抑制模块、动态降噪注意力模块构成，可模块化嵌入主流图像识别网络。实验结果表明，本文算法能够有效压制异常输入导致的连片全域激活，恢复网络稀疏编码特性；在马赛克、高斯噪点、模糊图像等测试样本中，模型平均激活幅值下降47.2%，图像分类准确率提升29.6%，且对正常自然图像的识别性能无明显负面影响。算法轻量化、即插即用，适用于分类、检测、分割等各类视觉任务。

关键词：图像识别；卷积神经网络；异常激活；人脑视觉机制；侧抑制；分布外样本

一、引言

1.1 研究背景与问题

深度学习凭借强大的特征提取能力，已广泛应用于图像分类、目标检测、语义分割等计算机视觉领域。卷积神经网络依靠层级化特征提取与稀疏激活机制完成视觉感知，正常自然图像仅会激活少量对应边缘、纹理、语义的神经元，多数神经元处于静息状态。

当网络输入马赛克图像、密集噪点图像、严重模糊图像等分布外（Out-of-Distribution, OOD）样本时，图像存在大量高频像素跳变与无规则边缘，会触发网络浅层卷积核全域响应。由于传统前馈卷积网络仅具备单向信号传递能力，无神经元相互抑制、无激活幅值约束、无噪声主动筛选，浅层异常高激活会逐层向后传播，最终造成全网络神经元集体亢奋、特征编码失效，模型输出结果随机、置信度异常。

该问题在安防图像、压缩失真图像、低画质采集图像等实际工程场景中频繁出现，严重限制视觉模型的鲁棒性。

1.2 现有研究现状

目前针对图像噪声、分布外样本的优化方案主要分为三类：

数据增强类：通过在训练集中添加噪点、马赛克样本扩充数据集，让模型学习畸变特征，但无法从机制上解决推理阶段的全域激活问题，且易污染原始特征；
图像预处理类：使用滤波、去模糊、降噪算法对输入图像修复，额外增加计算开销，复杂马赛克场景修复效果有限；
网络结构优化类：引入注意力、正则化、Dropout等模块缓解过激活，但缺乏针对性抑制连片神经元激活的设计，对马赛克引发的全域亢奋抑制效果较差。

现有方法均未从神经调控机理角度解决问题，而人脑视觉系统面对同类干扰时表现出极强的鲁棒性：视觉皮层产生瞬时兴奋后，抑制性神经元会快速启动侧抑制、全局调控，结合认知判断过滤无效噪声，始终维持神经放电的稀疏性与稳态。基于此，仿生神经抑制机制成为解决该问题的新思路。

1.3 本文主要工作

分析人脑视觉系统应对高频噪点、马赛克图案的多级调控原理，建立生物机制与深度学习模块的映射关系；
设计一套轻量化仿生抑制算法框架，包含噪声判别、激活稳态约束、局部侧抑制、动态降噪注意力四大核心模块，实现自适应抑制异常激活；
将算法模块化嵌入主流CNN网络，开展对比实验，验证算法对异常激活的压制能力与模型识别精度提升效果；
测试算法在正常图像、噪点图像、马赛克图像下的通用性与鲁棒性。

1.4 论文组织结构

本文剩余章节安排如下：第二章阐述人脑视觉抑制机理与传统网络激活缺陷；第三章详细介绍本文仿生算法整体框架与各模块原理；第四章给出实验设置、结果与分析；第五章总结全文并展望未来研究方向。

二、相关机理与理论基础

2.1 人脑视觉系统的抗干扰调控机制

人类视觉皮层是一套具备兴奋-抑制双向调控的复杂神经系统，面对马赛克、密集噪点等强干扰图案，完整调控流程分为五个阶段：

瞬时特征响应：视网膜与初级视觉皮层对图像边缘、像素梯度产生快速兴奋，对应视觉神经元短时放电增强；
局部侧抑制：大脑内GABA抑制性神经元发挥作用，相邻神经元相互压制，避免局部区域神经元同步连片高放电，阻断兴奋信号横向蔓延；
全局噪声判别：高级认知脑区对视觉信息解析，判定马赛克、噪点为无意义无效信息，主动下调整体神经活跃度；
注意力筛选：视觉注意力机制聚焦潜在有效区域，大幅弱化对高频噪声区域的感知权重；
神经稳态约束：人脑神经元放电频率存在天然生理上限，整体激活水平被约束在合理区间，不会出现无限亢奋。

上述多级调控协同作用，使人脑即便面对强干扰视觉信号，也能保持稀疏编码特性，不会出现全域神经紊乱。

2.2 传统卷积网络的激活缺陷

主流卷积神经网络为前馈单向传播结构，与人脑视觉系统存在本质差异，也是异常激活产生的根源：

无抑制回路：网络仅实现信号加权、非线性变换，神经元之间不存在相互抑制逻辑，连片特征触发后会集体高激活；
无幅值约束：神经元激活值可无限累加，高频干扰信号会逐层放大；
无主动噪声判别：模型仅依据训练数据拟合特征，无法自主区分有效图像与噪声干扰，对分布外样本无自适应处理能力；
稀疏激活依赖训练：网络稀疏编码是训练后的结果，并非固有机制，面对训练集以外的马赛克、噪点图案，稀疏性完全失效。

以ReLU激活函数为例，马赛克图像的密集像素梯度使神经元前置加权和恒大于0，神经元持续处于激活状态，最终形成全域异常高激活。

2.3 特征图激活评价指标

为量化网络激活状态，本文定义两个核心评价指标：

层平均激活幅值：单张特征图所有像素激活值的均值，反映整体激活强度；
高激活占比：特征图中激活值大于正常阈值的像素数量占比，用于判断是否出现连片全域激活。

三、仿生抑制算法设计

3.1 算法整体框架

本文算法完整复刻人脑五级调控逻辑，整体流水线为：输入图像 → 噪声判别模块 → 激活稳态约束模块 → 局部侧抑制模块 → 动态降噪注意力模块 → 特征输出。

算法采用即插即用模块化设计，可嵌入卷积网络每一层卷积、激活函数之后。模块具备自适应特性：检测到马赛克/噪点等异常输入时，自动增强抑制强度；面对正常自然图像时，降低调控力度，保证原始特征不受破坏。整体框架如图1所示（文字描述：串行四级模块，输入特征依次经过判别、约束、侧抑制、注意力处理，输出优化后特征）。

3.2 噪声判别模块

该模块模拟人脑认知区的噪声判定功能，结合空间梯度与频域特征区分正常图像、马赛克、随机噪点、模糊图像，输出二值标签 is_noise \in {0,1}，0代表正常图像，1代表异常干扰图像。

空间梯度计算
马赛克与噪点存在大量像素突变边缘，利用Sobel算子计算图像全局梯度总和，梯度密度越高，噪声特征越明显。
频域特征分析
对图像做二维快速傅里叶变换（FFT），正常图像能量集中在中低频区域，马赛克、随机噪点能量集中在高频区域，模糊图像高频能量极低。通过计算高频能量占比判定图像类型。
判别规则
当图像全局梯度密度大于阈值且高频能量占比大于阈值时，判定为异常干扰图像。该模块为后续所有调控模块提供自适应参数依据。

3.3 激活稳态约束模块

模拟人脑神经放电幅值上限，对特征图做动态软截断，限制神经元激活值范围，防止激活值无限累加。

设特征图为 F \in \mathbb{R}^{B,C,H,W}，计算单张特征图的全局均值 \mu 与标准差 \sigma，动态上下阈值公式：

\begin{cases}

T_{high} = \mu + \alpha \cdot \sigma \

T_{low} = \mu - \beta \cdot \sigma

\end{cases}

其中：\alpha、\beta 为超参数。检测到异常图像时，自动缩小 \alpha，收紧上限阈值，强化压制效果；正常图像使用基础阈值，保留特征动态范围。

最终输出：

F_{stable} = \mathrm{clamp}(F,\ T_{low},\ T_{high})

3.4 局部侧抑制模块

本文核心模块，模拟人脑侧抑制回路，解决马赛克引发的连片同步激活问题。对特征图每个像素取3×3邻域，利用邻域激活值对中心像素做压制。

取中心像素值 x_0，邻域8个像素求均值 \bar{x}_{neigh}；
侧抑制计算：
x_{out} = x_0 - \gamma \cdot \bar{x}_{neigh}
\gamma 为抑制系数，异常图像下增大 \gamma，提升抑制强度；
结合ReLU激活函数，负值置0，彻底消除无效高激活。

该模块特性：自然图像的有效边缘、纹理邻域激活差异大，抑制作用微弱；马赛克图像整片区域同步高激活，邻域均值极高，会被强力压制。

3.5 动态降噪注意力模块

模拟人脑选择性注意力机制，生成空间掩码对噪声区域降权。针对高梯度、高频噪点区域，掩码权重趋近于0，弱化特征响应；针对连续纹理、低梯度的有效区域，掩码权重趋近于1，保留原始特征。特征融合公式：

F_{att} = F \odot M

\odot 为逐像素相乘，M 为注意力掩码。正常图像场景下掩码全为1，模块不生效。

3.6 模块组合与网络嵌入规则

嵌入位置：优先嵌入网络浅层卷积层后（马赛克、噪点最先干扰浅层特征），中深层可间隔嵌入，阻断异常激活向后传播；
执行顺序：严格按照「噪声判别→稳态约束→侧抑制→注意力」执行，保证调控逻辑与人脑机理一致；
轻量化设计：所有模块仅使用基础卷积、池化、FFT运算，参数量增加低于2%，推理速度损耗可忽略。

四、实验与结果分析

4.1 实验环境与数据集

4.1.1 实验环境

硬件：NVIDIA RTX 3090 GPU；

软件：Python 3.8、PyTorch 1.10、CUDA 11.3；

基础网络：选用经典CNN模型LeNet、ResNet18作为测试主干网络。

4.1.2 实验数据集

基础数据集：ImageNet子集（10类图像，共10000张正常自然图像），用于测试模型正常性能；
异常样本集：基于基础图像生成三类干扰样本：

马赛克图像：分4种马赛克块尺寸；
高斯噪点图像：设置3种噪声强度；
高斯模糊图像：设置3种模糊半径。
异常样本总计6000张，用于测试算法抗异常激活能力。

4.2 对比实验设置

设置三组对照组：

原始网络：未添加任何优化模块的基础CNN；
传统降噪预处理：对输入图像使用高斯滤波降噪后输入网络；
本文算法：将仿生抑制模块嵌入基础网络。

评价指标：层平均激活幅值、高激活像素占比、图像分类准确率。

4.3 激活状态对比实验

以马赛克图像为输入，统计网络第一层、中间层、最后一层特征图的平均激活幅值与高激活占比，结果如表1所示。

表1 不同网络在马赛克图像下的激活状态对比

网络方案浅层平均激活值中层平均激活值深层平均激活值高激活像素占比(%)

原始网络 4.26 5.18 5.73 92.7

图像预处理降噪 3.12 3.85 4.21 71.3

本文仿生算法 1.84 2.16 2.49 28.5

实验分析：

原始网络面对马赛克图像，三层特征均保持极高激活水平，超90%像素处于高激活状态，全域亢奋现象严重；
传统图像预处理仅能小幅降低激活强度，无法解决连片激活问题；
本文算法将整体平均激活幅值下降47.2%，高激活像素占比降至28.5%，网络恢复稀疏激活特性，异常全域激活被有效压制。

4.4 识别精度对比实验

分别在正常图像、马赛克、噪点、模糊图像上测试分类准确率，结果如表2所示。

表2 分类准确率对比（%）

网络方案正常图像马赛克图像高斯噪点模糊图像

原始网络 91.5 32.1 40.6 58.2

图像预处理降噪 90.8 48.5 56.3 67.9

本文仿生算法 91.2 61.7 68.9 79.5

实验分析：

本文算法对正常图像准确率几乎无损失（仅下降0.3%），证明模块不会破坏原始特征表达；
在马赛克这类强干扰样本上，相比原始网络准确率提升29.6%，提升效果最为显著；
针对噪点、模糊图像，精度也实现大幅提升，算法具备通用抗干扰能力。

4.5 消融实验

为验证各模块的有效性，在马赛克数据集上开展消融实验，逐步移除模块观察指标变化，结果如表3。

表3 模块消融实验

实验组合平均激活值分类准确率(%)

完整算法（四模块） 2.16 61.7

移除侧抑制模块 3.72 45.3

移除稳态约束模块 3.48 47.1

移除噪声判别模块 2.95 52.8

移除注意力模块 2.53 56.4

结论：局部侧抑制模块是抑制连片异常激活的核心，移除后性能下降最明显；四大模块相互配合，共同构成完整的仿生调控体系，缺一不可。

4.6 推理效率测试

统计单张图像平均推理耗时：原始网络2.1ms，嵌入本文算法后2.3ms，耗时增加不足10%。算法轻量化优势明显，可满足实时视觉任务需求。

五、总结与展望

5.1 工作总结

针对马赛克、噪点、模糊图像引发卷积神经网络全域异常高激活的问题，本文深入研究人脑视觉系统的兴奋-抑制调控机理，提出一套仿生人脑抑制机制的视觉算法。主要结论如下：

传统前馈CNN缺乏神经元抑制与激活约束，是分布外图像产生全域异常激活的根本原因；
本文设计的噪声判别、激活稳态约束、局部侧抑制、动态注意力四大模块，精准复刻人脑多级抗干扰逻辑，可自适应压制异常激活；
实验证明，该算法能大幅降低异常输入下的网络激活强度，恢复稀疏编码特性，显著提升低画质图像的识别精度，同时不影响正常图像性能，且计算开销小、通用性强。

5.2 未来展望

优化频域-空间域联合判别算法，提升复杂混合噪声、动态马赛克视频帧的识别精度；
将仿生抑制机制拓展至Transformer、YOLO、Mask R-CNN等视觉模型，适配更多下游任务；
结合生物神经动力学，引入动态自适应抑制系数，进一步模拟人脑神经动态调节过程；
面向极端低画质、强干扰工业场景，优化模块鲁棒性，落地于嵌入式视觉设备。

参考文献

$1$ 周志华. 机器学习 $M$ . 清华大学出版社, 2016.

$2$ 邱锡鹏. 神经网络与深度学习 $M$ . 机械工业出版社, 2020.

$3$ He K, Zhang X, Ren S, et al. Deep Residual Learning for Image Recognition $C$ //CVPR, 2016.

$4$ 王龙, 李建伟. 人脑视觉侧抑制机制及在图像处理中的应用 $J$ . 生物医学工程学杂志, 2019, 36(02):321-328.

$5$ 张军, 刘阳. 卷积神经网络分布外样本鲁棒性优化研究 $J$ . 计算机工程与应用, 2022, 58(11):123-131