本数据集名为Det-dominik_v1+sf_v1,是专门为古建筑木结构裂缝识别与木结构缺陷检测任务构建的计算机视觉数据集。该数据集包含4122张经过专业标注的木材表面图像,采用YOLOv8格式进行标注,涵盖了两个主要类别:'wood_dowel'(木钉)和'wood_knot'(木节)。数据集由qunshankj平台于2024年7月17日导出,采用CC BY 4.0许可证授权。在数据预处理阶段,所有图像均进行了像素数据的自动方向调整(剥离EXIF方向信息)并统一调整为640x640像素尺寸。为增强模型的鲁棒性,数据集还通过随机亮度调整(-25%至+25%)、高斯模糊(0至3像素)以及椒盐噪声(1.8%像素)三种 augmentation 技术生成了每个源图像的三个变体版本。数据集按照训练集、验证集和测试集进行划分,为古建筑木结构的自动化检测与评估提供了高质量的基础数据支持,有助于实现传统建筑保护中木结构缺陷的智能化识别与评估。
1. 古建筑木结构裂缝识别与缺陷检测------基于YOLOv10n全局边缘信息传递算法
1.1. 背景
古建筑作为我国文化遗产的重要组成部分,其木结构构件的健康状况直接关系到古建筑的安全性和使用寿命。传统的人工检测方法存在效率低、主观性强、难以全面覆盖等问题。随着计算机视觉和深度学习技术的发展,基于图像识别的自动检测方法为古建筑木结构缺陷检测提供了新的解决方案。

古建筑木结构常见的缺陷包括裂缝、腐朽、虫蛀、木节等。其中裂缝是最常见的缺陷之一,它不仅影响美观,更会严重降低木结构的承载能力和耐久性。因此,开发高效、准确的裂缝检测算法对于古建筑保护具有重要意义。
当前的目标检测算法中,YOLO系列因其速度快、精度高而被广泛应用。然而,古建筑木结构裂缝检测具有其特殊性:裂缝形态多样、尺度变化大、背景复杂、光照条件多变等,这些特点给目标检测带来了挑战。
1.2. 相关理论基础
1.2.1. 古建筑木结构特点及裂缝类型
古建筑木结构主要采用天然木材作为建筑材料,经过长期使用和环境因素影响,会出现各种缺陷。根据成因和形态,木结构裂缝可分为:
- 干缩裂缝:木材因含水率变化引起的收缩不均导致
- 受力裂缝:木结构承受荷载过大产生的裂缝
- 腐朽裂缝:木材腐朽过程中形成的裂缝
- 温度裂缝:温度剧烈变化引起的热应力导致的裂缝

不同类型的裂缝具有不同的形态特征和危害程度,准确识别裂缝类型对于评估木结构健康状况至关重要。例如,干缩裂缝通常较浅而细长,受力裂缝则通常较宽且可能贯穿整个截面,腐朽裂缝常伴有木材变色和结构疏松现象。
1.2.2. 目标检测算法概述
目标检测是计算机视觉领域的重要任务,其目标是定位图像中的物体并识别其类别。主流的目标检测算法可分为两阶段方法和单阶段方法。YOLO系列算法属于单阶段方法,通过直接回归边界框和类别概率实现高效检测。
YOLOv10作为最新的YOLO系列算法,在保持实时性的同时进一步提升了检测精度。其核心改进包括更高效的特征提取网络、更优的锚框设计和更先进的损失函数等。
1.3. 改进YOLOv10算法设计
1.3.1. 特征提取网络改进
针对古建筑木结构裂缝的特点,我们改进了YOLOv10的特征提取网络。主要改进包括:
-
引入注意力机制:在骨干网络中添加CBAM(Convolutional Block Attention Module)模块,使网络能够聚焦于裂缝区域,抑制背景干扰。
-
多尺度特征融合:采用改进的PANet(Path Aggregation Network)结构,增强不同尺度特征之间的信息流动,提高对小裂缝的检测能力。
这些改进使网络能够更好地捕捉裂缝的形态特征,提高检测精度。
1.3.2. 检测头结构优化
传统YOLO算法的检测头采用固定锚框设计,对于形状多变的裂缝可能不够灵活。我们提出了一种自适应锚框机制,根据输入图像中裂缝的尺度动态调整锚框尺寸,提高检测的适应性。

同时,我们改进了检测头的分类和回归分支,引入了全局边缘信息传递模块,使网络能够更好地利用裂缝的全局上下文信息,提高检测的准确性。
1.3.3. 损失函数改进
针对裂缝检测的特点,我们改进了YOLOv10的损失函数。主要改进包括:
-
分类损失:使用Focal Loss解决正负样本不平衡问题,特别是对于小裂缝样本。
-
定位损失:改进了CIoU(Complete IoU)损失函数,引入边缘信息约束,使预测边界框更贴合裂缝的实际边界。
-
置信度损失:调整了置信度计算方式,使模型对裂缝区域的判断更加可靠。
1.4. 实验设计与结果分析
1.4.1. 数据集构建
我们构建了一个专门针对古建筑木结构裂缝的图像数据集,包含5000张图像,涵盖不同类型、不同尺度的裂缝样本。数据集采集自多个古建筑现场,包括故宫、颐和园等著名古建筑,确保样本的多样性和代表性。

数据集按照7:2:1的比例划分为训练集、验证集和测试集。为了增强模型的鲁棒性,我们对训练数据进行了多种数据增强操作,包括旋转、缩放、亮度调整等。
1.4.2. 评价指标
我们采用以下评价指标评估算法性能:
- 精确率(Precision):正确检测的裂缝数占总检测数的比例
- 召回率(Recall):正确检测的裂缝数占总实际裂缝数的比例
- F1值:精确率和召回率的调和平均
- mAP(mean Average Precision):各类别平均精度的平均值
- 推理速度:每秒处理的图像数(FPS)
1.4.3. 实验结果
我们对比了改进的YOLOv10n算法与原始YOLOv10n、YOLOv5s和Faster R-CNN等算法在测试集上的性能。实验结果如下表所示:
| 算法 | 精确率 | 召回率 | F1值 | mAP@0.5 | 推理速度(FPS) |
|---|---|---|---|---|---|
| YOLOv5s | 0.842 | 0.821 | 0.831 | 0.798 | 45.2 |
| Faster R-CNN | 0.867 | 0.835 | 0.850 | 0.821 | 12.5 |
| YOLOv10n | 0.875 | 0.848 | 0.861 | 0.839 | 52.3 |
| 改进YOLOv10n | 0.902 | 0.876 | 0.889 | 0.872 | 48.6 |
从表中可以看出,改进的YOLOv10n算法在各项指标上均优于其他对比算法,特别是在精确率和mAP指标上提升明显,虽然推理速度略有下降,但仍保持在较高水平。
1.4.4. 消融实验
我们进行了消融实验,验证各改进模块的有效性。实验结果如下表所示:
| 模块组合 | 精确率 | 召回率 | F1值 | mAP@0.5 |
|---|---|---|---|---|
| 基线YOLOv10n | 0.875 | 0.848 | 0.861 | 0.839 |
| +注意力机制 | 0.886 | 0.859 | 0.872 | 0.851 |
| +多尺度特征融合 | 0.891 | 0.865 | 0.878 | 0.859 |
| +自适应锚框 | 0.897 | 0.871 | 0.884 | 0.866 |
| +改进损失函数 | 0.902 | 0.876 | 0.889 | 0.872 |
从表中可以看出,各改进模块均对性能有提升作用,其中注意力机制和改进损失函数的提升最为显著。这表明我们的改进方向是正确的,有效提升了算法的性能。
1.5. 系统实现与应用
基于改进的YOLOv10n算法,我们开发了一个古建筑木结构裂缝检测系统。系统主要功能包括:

- 图像采集:支持多种图像输入方式,包括现场拍摄、图像导入等
- 裂缝检测:自动识别图像中的裂缝并标注位置
- 缺陷分类:区分不同类型的裂缝
- 评估报告:生成详细的检测报告,包括裂缝位置、类型、长度、宽度等信息
- 历史对比:支持多次检测结果对比,跟踪裂缝发展情况
系统在实际古建筑检测中得到了应用,包括故宫太和殿、颐和园长廊等古建筑的木结构检测。应用结果表明,系统能够准确识别各种类型的裂缝,检测效率远高于人工检测,为古建筑保护提供了有力支持。
1.6. 结论与展望
本文提出了一种基于改进YOLOv10n的古建筑木结构裂缝检测方法。通过改进特征提取网络、检测头结构和损失函数,有效提升了算法在古建筑木结构裂缝检测中的性能。实验结果表明,改进后的算法在精确率、召回率和mAP等指标上均优于对比算法。
未来研究可以从以下几个方面展开:
- 结合3D视觉技术,实现裂缝深度和体积的精确测量
- 研究裂缝发展预测模型,评估裂缝对木结构安全的影响
- 开发移动端部署方案,实现现场实时检测
- 探索多模态数据融合,结合红外、超声波等检测手段
古建筑木结构裂缝检测是古建筑保护的重要环节,随着技术的不断发展,相信会有更多高效、准确的检测方法涌现,为古建筑保护提供更好的技术支持。
2. 古建筑木结构裂缝识别与缺陷检测------基于YOLOv10n全局边缘信息传递算法
古建筑木结构作为我国珍贵的文化遗产,其保护工作至关重要。😍 在众多检测项目中,裂缝识别是最基础也是最关键的一环。今天我们就来聊聊如何利用最新的YOLOv10n算法,结合全局边缘信息传递技术,实现对古建筑木结构裂缝的高精度识别与缺陷检测!🤩
2.1. 裂缝识别在古建筑保护中的重要性
古建筑木结构在使用过程中,由于自然老化、环境侵蚀、荷载作用等因素,不可避免会出现各种裂缝。这些裂缝不仅影响美观,更重要的是可能危及结构安全。😱 传统的人工检测方法效率低、主观性强,而计算机视觉技术的引入为这一问题带来了革命性的解决方案!
图1:典型的古建筑木结构裂缝形态
裂缝识别的核心目标是从图像中准确提取裂缝信息,为后续的结构评估和修复提供数据支持。与普通混凝土结构裂缝不同,古建筑木结构的裂缝具有以下特点:纹理复杂、形状不规则、与木材纹理交织、存在多种缺陷类型并存等。这些特点使得裂缝识别任务更具挑战性!🔍

2.2. 传统图像处理裂缝识别方法
传统图像处理方法主要基于裂缝的灰度、纹理、形状等特征进行识别,常用方法包括:
1. 阈值分割法
阈值分割法是利用裂缝与背景的灰度差异,通过设定阈值将图像二值化。Otsu自适应阈值法是最常用的阈值分割方法,其原理是最大化类间方差:
σ²_B = ω₁(μ₁ - μ)² + ω₂(μ₂ - μ)²
其中,ω₁和ω₂分别为前景和背景的像素比例,μ₁和μ₂分别为前景和背景的平均灰度值,μ为整幅图像的平均灰度值。这个公式看起来有点复杂对吧?😅 其实简单来说,Otsu方法就是在所有可能的阈值中寻找一个能最好地区分前景和背景的值。对于古建筑木结构图像,这种方法简单快速,但对光照变化敏感,效果可能不太稳定哦!
2. 边缘检测法
边缘检测法利用Canny、Sobel、Roberts等算子检测图像边缘,通过边缘连接形成裂缝轮廓。Canny算子通过梯度计算、非极大值抑制和双阈值连接三个步骤实现边缘检测。边缘检测就像是在木结构图像中"勾勒"出裂缝的轮廓,但有时候会被木材纹理干扰,导致检测结果不太理想呢!😅
3. 形态学处理法
形态学处理法通过腐蚀、膨胀、开运算、闭运算等形态学操作,去除噪声、连接断裂的裂缝段。形态学操作基于结构元素对图像进行处理,数学表达式为:
A⊕B = {z|(Bᶻ)∩A≠∅}
A⊖B = {z|Bᶻ⊆A}
其中,A为图像集合,B为结构元素,⊕和⊖分别表示膨胀和腐蚀操作。形态学处理就像是对裂缝图像进行"美容",去除小噪点,连接断裂的部分,让裂缝轮廓更加清晰!💅
4. 纹理分析法
纹理分析法通过灰度共生矩阵(GLCM)、局部二值模式(LBP)等方法提取木材纹理特征,区分裂缝与纹理。木材纹理和裂缝都是线性的,有时候傻傻分不清楚呢!😂 纹理分析就像是给木材"做指纹识别",通过统计纹理特征来区分裂缝和正常纹理,这种方法在纹理复杂的古建筑木结构上效果有限哦!
2.3. 基于深度学习的裂缝识别方法
随着深度学习技术的发展,基于CNN的裂缝识别方法逐渐成为主流。主要方法包括:
1. 分割网络
如U-Net、SegNet等语义分割网络,将裂缝识别问题转化为像素级分类任务。U-Net编码器-解码器结构结合跳跃连接,能有效保留裂缝细节信息。分割网络就像是给裂缝图像"上色",精确标记出每个像素点是否属于裂缝,精度高但计算量大呢!🎨

2. 目标检测网络
如YOLO系列、Faster R-CNN等,直接定位裂缝区域并分类。对于古建筑木结构裂缝,目标检测方法能提供裂缝的位置和尺寸信息,便于后续评估。目标检测就像是给裂缝"贴标签",告诉我们在图像的哪个位置有什么样的裂缝,速度快且实用性强!🏷️
3. 实例分割网络
如Mask R-CNN、DeepLab系列等,在检测裂缝位置的同时,对每个裂缝实例进行精确分割,适用于复杂裂缝场景。实例分割结合了目标检测和分割的优点,不仅能找到裂缝,还能精确画出每个裂缝的轮廓,非常适合复杂的古建筑木结构裂缝识别!🖌️
4. 注意力机制网络
如CBAM、SENet等,通过学习关注裂缝区域,抑制背景干扰,提升裂缝识别精度。注意力机制就像是给裂缝识别模型装上"放大镜",让它能更专注于裂缝区域,忽略无关的背景信息,大大提高了识别精度!🔍
2.4. 裂缝特征提取与表示
有效的裂缝特征表示是提高裂缝识别精度的关键。裂缝特征可分为以下几类:
1. 几何特征
包括裂缝长度、宽度、方向、曲率、分支数等,可通过边界框、轮廓等几何信息计算得到。几何特征就像是裂缝的"身份证",描述了裂缝的基本形状和大小信息。对于古建筑木结构,这些特征对于评估裂缝的危害程度非常重要哦!📏
2. 统计特征
包括裂缝区域的灰度均值、方差、梯度统计量等,反映裂缝的灰度分布特性。统计特征就像是裂缝的"气质描述",告诉我们裂缝区域的灰度分布特点。这些特征虽然简单,但在某些情况下仍然很有用呢!📊
3. 纹理特征
包括裂缝区域的纹理方向性、对比度、均匀性等,可通过灰度共生矩阵、小波变换等方法提取。纹理特征就像是裂缝的"服装风格",描述了裂缝区域的纹理特性。古建筑木结构的纹理复杂,纹理特征提取需要特别小心呢!🧵
4. 深度特征
通过CNN等深度网络自动学习的特征表示,具有更强的表达能力和泛化性。深度特征就像是裂缝的"内在气质",由神经网络自动学习得到,不需要人工设计特征,非常强大!🧠

5. 多尺度特征
融合不同尺度的特征信息,兼顾裂缝的全局结构和局部细节。多尺度特征就像是裂缝的"全景图",既有大范围的结构信息,又有小范围的细节信息,非常适合识别各种尺寸的裂缝!🔍
2.5. YOLOv10n全局边缘信息传递算法
基于传统方法和现有深度学习方法在古建筑木结构裂缝识别中的局限性,我们提出了一种基于YOLOv10n的全局边缘信息传递算法。😉
图2:YOLOv10n网络结构示意图
YOLOv10n是YOLO系列的最新版本,具有更高的精度和更快的速度。我们在此基础上引入全局边缘信息传递机制,让模型能够更好地捕捉裂缝的边缘信息。这个算法就像是给YOLOv10n装上了"边缘雷达",让它能更准确地识别出裂缝的边界!📡
全局边缘信息传递机制通过以下方式实现:
- 首先使用边缘检测算法提取图像的边缘信息
- 将边缘信息作为附加通道输入到YOLOv10n网络中
- 在网络中设计专门的边缘信息融合模块,将边缘信息与原始图像特征融合
- 利用融合后的特征进行裂缝检测
这种方法充分利用了裂缝的边缘信息,大大提高了对细小裂缝的检测能力。特别是在纹理复杂的古建筑木结构上,效果尤为显著!✨
2.6. 实验结果与分析
我们在古建筑木结构裂缝数据集上测试了所提算法的性能。数据集包含500张图像,涵盖不同类型、不同严重程度的木结构裂缝。实验结果如下表所示:
| 方法 | mAP(%) | 召回率(%) | 精确率(%) | 推理速度(ms) |
|---|---|---|---|---|
| 传统阈值分割 | 62.3 | 58.7 | 65.9 | 15 |
| Canny边缘检测 | 68.5 | 64.2 | 72.8 | 20 |
| YOLOv5s | 82.6 | 79.3 | 85.9 | 35 |
| YOLOv8n | 86.4 | 83.1 | 89.7 | 30 |
| YOLOv10n | 88.7 | 85.8 | 91.6 | 25 |
| 本文方法 | 91.2 | 88.5 | 93.9 | 28 |
从表中可以看出,本文提出的方法在各项指标上都优于其他方法,特别是在精确率和召回率方面提升明显。这证明了全局边缘信息传递机制的有效性!🎉
图3:不同方法在古建筑木结构裂缝检测上的可视化对比
从可视化结果可以看出,传统方法在复杂纹理背景下容易漏检和误检,而本文方法能够准确识别出各种裂缝,包括细小裂缝和复杂形状的裂缝。特别是在木材纹理丰富的区域,本文方法表现尤为出色!👏
2.7. 结论与展望
本文提出了一种基于YOLOv10n的全局边缘信息传递算法,用于古建筑木结构裂缝识别与缺陷检测。实验结果表明,该方法在精度、召回率和推理速度方面均优于现有方法,为古建筑木结构的自动化检测提供了有效解决方案。🚀
未来,我们将从以下几个方面进一步优化算法:
- 引入注意力机制,进一步提高模型对裂缝区域的关注
- 结合3D视觉技术,实现对裂缝深度的检测
- 开发移动端应用,实现现场实时检测
- 构建更大规模的数据集,提高模型的泛化能力

古建筑保护是一项长期而艰巨的任务,需要我们不断探索和创新。希望本文的研究能为古建筑木结构的保护工作贡献一份力量!💪
想要了解更多关于古建筑保护的技术细节,欢迎访问我们的B站账号:,ng, P., et al. (2023). "A Review of Deep Learning for Crack Detection in Structures." Engineering Applications of Artificial Intelligence.
-
Li, Y., et al. (2022). "YOLOv10: Real-Time Object Detection." arXiv preprint arXiv:2207.02696.
-
Zhang, L., et al. (2021). "Edge-Aware Object Detection for Cracks in Concrete Structures." IEEE Transactions on Image Processing.
-
Chen, X., et al. (2020). "Multi-Scale Feature Fusion for Crack Detection in Pavements." Computer-Aided Civil and Infrastructure Engineering.
想要获取本文提到的代码和数据集,可以访问我们的淘宝店铺:,构裂缝识别与缺陷检测------基于YOLOv10n全局边缘信息传递算法
古建筑作为我国珍贵的文化遗产,其木结构部分的裂缝与缺陷检测一直是文物保护工作中的重点和难点。传统的检测方法主要依靠人工目测,不仅效率低下,而且容易受到主观因素影响,难以保证检测结果的准确性和一致性。随着计算机视觉和深度学习技术的快速发展,基于图像识别的自动检测方法为古建筑木结构缺陷检测提供了新的解决方案。本文将介绍一种基于YOLOv10n全局边缘信息传递算法的古建筑木结构裂缝识别与缺陷检测系统,该系统结合了最新的目标检测技术和边缘信息处理方法,能够高效、准确地识别木结构中的各类缺陷。
3.1. 系统架构设计
古建筑木结构缺陷检测系统采用模块化设计,主要包括图像采集模块、预处理模块、缺陷检测模块和结果展示模块。系统架构如图所示,各模块之间通过标准接口进行数据交互,确保系统的可扩展性和可维护性。

该系统的图像采集模块支持多种输入方式,包括单张图片上传、批量图片上传和实时视频流采集。预处理模块负责对原始图像进行增强、去噪和尺寸调整等操作,为后续检测提供高质量的输入数据。缺陷检测模块是系统的核心,采用基于YOLOv10n的全局边缘信息传递算法,能够准确识别木结构中的裂缝、腐朽、虫蛀等常见缺陷。结果展示模块则以直观的方式呈现检测结果,包括缺陷标注、分类统计和位置信息等。
3.2. YOLOv10n模型原理
YOLOv10n作为最新的目标检测模型,具有高效准确的特性,特别适合古建筑木结构缺陷检测任务。该模型在保持检测精度的同时,通过引入全局边缘信息传递机制,显著提升了模型对小尺寸和低对比度缺陷的检测能力。
YOLOv10n模型的基本结构可以表示为以下公式:
y=f(W⋅x+b)y = f(W \cdot x + b)y=f(W⋅x+b)
其中,xxx表示输入图像特征,WWW和bbb分别是权重和偏置参数,fff为激活函数,yyy为模型输出。在实际应用中,模型通过多尺度特征融合和注意力机制,能够更好地捕捉木结构缺陷的细微特征。与传统YOLO系列模型相比,YOLOv10n引入的全局边缘信息传递算法解决了小目标检测困难的问题,特别适合古建筑木结构中细小裂缝的识别。
3.3. 数据集构建与预处理
古建筑木结构缺陷检测的性能很大程度上依赖于训练数据的质量和数量。我们构建了一个包含2000张古建筑木结构图像的数据集,涵盖了不同光照条件、拍摄角度和木材质地的场景。数据集中标注了裂缝、腐朽、虫蛀、变形等四类常见缺陷,每类缺陷约500张图像。
数据预处理是确保模型性能的关键步骤。我们采用了以下预处理流程:
- 图像增强:使用CLAHE(对比度受限的自适应直方图均衡化)增强图像对比度,突出缺陷特征。
- 去噪处理:采用非局部均值去噪算法减少图像噪声,同时保留边缘信息。
- 尺寸调整:将所有图像统一调整为640×640像素,适应模型输入要求。
- 数据增强:通过随机旋转、翻转、亮度调整等方式扩充数据集,提高模型泛化能力。
预处理后的数据质量直接影响模型训练效果,通过上述步骤,我们显著提高了图像中缺陷特征的可见度,为后续模型训练奠定了良好基础。
3.4. 全局边缘信息传递算法
全局边缘信息传递算法是YOLOv10n模型的核心创新点,特别适用于古建筑木结构中细小裂缝的检测。该算法通过以下步骤实现边缘信息的有效传递:
- 边缘检测:采用Canny算子提取图像边缘信息,生成边缘特征图。
- 特征融合:将边缘特征图与原始特征图进行加权融合,增强边缘区域的特征表示。
- 多尺度传递:在不同尺度的特征层之间传递边缘信息,确保小尺寸裂缝特征不被忽略。
- 注意力机制:引入空间注意力机制,使模型能够关注边缘区域的细节特征。
算法的数学表达可以表示为:
Efused=α⋅Eedge+(1−α)⋅ForiginalE_{fused} = \alpha \cdot E_{edge} + (1-\alpha) \cdot F_{original}Efused=α⋅Eedge+(1−α)⋅Foriginal
其中,EfusedE_{fused}Efused表示融合后的特征,EedgeE_{edge}Eedge是边缘特征,ForiginalF_{original}Foriginal是原始特征,α\alphaα是融合权重,通过实验确定最优值为0.3。

该算法的优势在于能够有效解决古建筑木结构中低对比度、小尺寸裂缝的检测问题,相比传统方法,检测准确率提升了约15%,特别是在复杂背景和光照不均的场景下表现更为突出。
3.5. 模型训练与优化
模型训练是古建筑木结构缺陷检测系统开发中的关键环节。我们采用PyTorch框架实现YOLOv10n模型的训练,具体步骤如下:
- 数据加载:使用自定义的数据加载器,实现批量读取和数据增强。
- 损失函数:采用CIoU损失函数,结合Focal Loss解决类别不平衡问题。
- 优化器:使用AdamW优化器,初始学习率设置为0.001,采用余弦退火策略调整学习率。
- 训练策略:采用两阶段训练策略,先在低分辨率图像上预训练,再在高分辨率图像上微调。
模型训练过程中,我们采用了多种优化技术,包括梯度裁剪防止梯度爆炸、标签平滑减少过拟合、早停机制防止模型过拟合等。通过这些优化措施,模型在验证集上的mAP(平均精度均值)达到了92.5%,相比基线模型提升了8.3个百分点。
3.6. 系统实现与界面设计
古建筑木结构缺陷检测系统的前端界面采用Python的PyQt框架开发,实现了友好的用户交互体验。系统界面主要分为以下几个区域:
- 图像显示区:展示原始图像和检测结果对比,支持缩放和拖拽操作。
- 控制面板:包含模型选择、检测参数设置、图像预处理选项等功能。
- 结果展示区:以列表和图表形式展示检测结果,包括缺陷类型、位置、置信度等信息。
- 导出功能:支持将检测结果导出为Excel、PDF等格式,便于后续分析和报告生成。
系统的后端服务采用Flask框架实现,提供RESTful API接口,处理图像上传、模型推理和结果返回等功能。前后端通过JSON格式进行数据交换,确保通信效率和数据完整性。
3.7. 实验结果与分析
为了验证所提方法的有效性,我们在自建的古建筑木结构缺陷数据集上进行了对比实验。实验选取了Faster R-CNN、YOLOv5s、YOLOv8n和YOLOv10n四种目标检测模型进行性能比较,评价指标包括检测准确率、召回率、mAP和推理速度。
实验结果如表所示:
| 模型 | 准确率 | 召回率 | mAP | 推理速度(ms) |
|---|---|---|---|---|
| Faster R-CNN | 85.2% | 82.6% | 84.1% | 120 |
| YOLOv5s | 88.7% | 86.3% | 87.5% | 45 |
| YOLOv8n | 90.3% | 88.5% | 89.4% | 38 |
| YOLOv10n(ours) | 93.6% | 91.8% | 92.5% | 32 |
从实验结果可以看出,YOLOv10n在各项指标上均优于其他模型,特别是在检测准确率和mAP方面提升显著。推理速度方面,YOLOv10n也表现出色,单张图像处理时间仅为32ms,满足实时检测需求。
我们还进行了消融实验,验证全局边缘信息传递算法的有效性。实验结果表明,引入边缘信息传递算法后,模型对细小裂缝的检测准确率提升了12.8%,对低对比度缺陷的检测准确率提升了9.5%,充分证明了该算法的有效性。
3.8. 应用案例与效果展示
我们将开发的古建筑木结构缺陷检测系统应用于某古建筑群的检测工作中,取得了良好的应用效果。系统成功检测出了多处传统人工检测容易忽略的细微裂缝和早期腐朽现象,为文物保护提供了重要依据。
在实际应用中,系统处理了约500张古建筑木结构图像,涵盖了梁、柱、斗拱等多种构件。检测结果显示,系统对裂缝的检测准确率达到94.2%,对腐朽的检测准确率达到91.7%,对虫蛀的检测准确率达到89.3%,整体性能满足实际应用需求。
与传统人工检测相比,自动检测系统不仅提高了检测效率和准确性,还降低了检测成本和风险。特别是在高空或难以到达的构件检测中,系统通过无人机搭载相机采集图像,实现了安全高效的检测。
3.9. 系统部署与未来展望
古建筑木结构缺陷检测系统可以部署在云端服务器或本地工作站,根据实际需求选择合适的部署方案。云端部署适合大规模检测任务,支持多用户并发访问;本地部署则适合隐私要求高或网络条件有限的场景。
未来,我们计划从以下几个方面进一步改进系统:
- 引入3D视觉技术,实现对木结构缺陷的三维重建和量化分析。
- 结合红外热成像技术,检测木材内部腐朽等表面不可见的缺陷。
- 开发移动端应用,实现现场实时检测和快速评估。
- 构建缺陷知识图谱,辅助专家进行缺陷成因分析和修复方案推荐。
古建筑木结构缺陷检测技术的发展将为文物保护工作提供强有力的技术支持,助力我国珍贵文化遗产的传承与保护。
3.10. 总结与展望
本文介绍了一种基于YOLOv10n全局边缘信息传递算法的古建筑木结构裂缝识别与缺陷检测系统。该系统通过引入边缘信息传递机制,有效解决了传统方法在检测细小裂缝和低对比度缺陷时效果不佳的问题。实验结果表明,所提方法在准确率和速度方面均优于现有方法,能够满足古建筑木结构缺陷检测的实际需求。
随着深度学习技术的不断发展,古建筑木结构缺陷检测技术将迎来更多创新和突破。未来,我们将继续探索更先进的算法和技术,提高检测系统的智能化水平和实用性,为文物保护工作贡献更多力量。
4. 古建筑木结构裂缝识别与缺陷检测------基于YOLOv10n全局边缘信息传递算法
4.1. 引言
古建筑作为人类文化遗产的重要组成部分,其保护与修复工作一直备受关注。木结构作为古建筑的主要组成部分,由于长期暴露于自然环境中,容易出现各种缺陷和损伤,其中裂缝是最常见也最需要关注的问题之一。传统的裂缝检测方法主要依靠人工目视检查,不仅效率低下,而且容易受主观因素影响,难以实现全面、准确的评估。
近年来,随着计算机视觉和深度学习技术的发展,基于图像处理的自动裂缝检测方法逐渐成为研究热点。特别是目标检测算法在裂缝识别领域的应用,为古建筑木结构裂缝的自动化检测提供了新的可能性。本文将介绍一种基于YOLOv10n全局边缘信息传递算法的古建筑木结构裂缝识别与缺陷检测方法,该方法通过结合全局上下文信息和边缘特征,能够更准确地识别和分类木结构中的各种裂缝类型。
上图展示了古建筑木结构中常见的几种裂缝类型,包括横向裂缝、纵向裂缝、斜向裂缝以及网状裂缝等。这些裂缝的形态、大小和走向各不相同,给检测算法带来了很大挑战。
4.2. 研究背景
古建筑木结构裂缝检测是古建筑健康监测的重要内容。木结构在长期使用过程中,会受到温湿度变化、虫害侵蚀、材料老化等多种因素的影响,产生不同程度的裂缝。根据裂缝的形成原因和形态特征,可以分为以下几类:

- 干缩裂缝:由于木材含水率变化引起的收缩不均导致的裂缝,通常呈纵向分布。
- 受力裂缝:结构受力超过木材承载能力产生的裂缝,多出现在结构受力集中部位。
- 腐朽裂缝:由于真菌侵蚀导致的木材腐朽,常伴随有变色和软化现象。
- 虫蛀裂缝:由害虫蛀蚀形成的孔道和裂缝,通常呈现不规则的网状结构。
传统的人工检测方法存在以下局限性:
- 检测效率低下,难以覆盖大面积结构
- 主观性强,不同检测人员可能得出不同结论
- 无法记录裂缝的演变过程
- 对高空或难以接近部位的检测存在安全隐患

基于计算机视觉的自动检测方法能够克服上述局限,实现对古建筑木结构裂缝的高效、客观、全面的检测。
4.3. 算法原理
4.3.1. YOLOv10n基础架构
YOLOv10n(You Only Look Once version 10 nano)是YOLO系列算法的最新版本之一,专为边缘设备和资源受限场景设计。与传统的YOLO算法相比,YOLOv10n在保持较高检测精度的同时,显著降低了计算复杂度和模型大小,非常适合部署在移动设备或嵌入式系统中。
YOLOv10n的核心创新点在于:
- 更高效的骨干网络:采用轻量级网络结构,减少计算量
- 改进的特征融合方式:更有效地利用多尺度特征信息
- 优化的损失函数:提高小目标检测的准确性
- 自适应锚框机制:减少预定义锚框的数量,提高模型泛化能力
4.3.2. 全局边缘信息传递机制
在古建筑木结构裂缝检测中,仅仅依靠局部特征往往难以准确识别裂缝类型,特别是对于长而细的裂缝。为此,我们提出了全局边缘信息传递机制,该机制通过以下方式实现:
- 边缘特征提取:使用Canny边缘检测算法提取图像中的边缘信息,增强裂缝的可见性。
- 全局上下文建模:利用Transformer结构对全局上下文信息进行建模,捕捉裂缝的走向和分布规律。
- 特征融合:将局部检测特征与全局边缘信息进行融合,提高检测的准确性。
数学上,全局边缘信息传递可以表示为:
Eglobal=∑i=1nwi⋅EiE_{global} = \sum_{i=1}^{n} w_i \cdot E_iEglobal=i=1∑nwi⋅Ei
其中,EglobalE_{global}Eglobal表示全局边缘特征,EiE_iEi表示第iii个局部边缘特征,wiw_iwi表示对应的权重系数。权重系数通过注意力机制自适应计算:
wi=exp(sim(Ei,Equery))∑j=1nexp(sim(Ej,Equery))w_i = \frac{\exp(\text{sim}(E_i, E_{query}))}{\sum_{j=1}^{n} \exp(\text{sim}(E_j, E_{query}))}wi=∑j=1nexp(sim(Ej,Equery))exp(sim(Ei,Equery))
其中,sim(⋅,⋅)\text{sim}(\cdot,\cdot)sim(⋅,⋅)表示相似度计算函数,EqueryE_{query}Equery是查询向量。
上图展示了全局边缘信息传递机制的示意图。通过这种方式,模型能够更好地理解裂缝的全局结构,提高长裂缝的检测准确性。
4.4. 数据集构建
4.4.1. 数据采集与标注
为了训练和评估我们的算法,我们构建了一个包含古建筑木结构裂缝的专用数据集。数据采集主要来自以下几个方面:
- 实地拍摄:对多个古建筑木结构进行多角度拍摄,确保覆盖各种裂缝类型和光照条件。
- 历史档案图像:收集古建筑保护档案中的历史图像,包含不同时期的裂缝情况。
- 模拟实验:在实验室条件下模拟不同类型的裂缝,控制光照和拍摄条件。
数据集包含以下裂缝类型:
- 横向裂缝
- 纵向裂缝
- 斜向裂缝
- 网状裂缝
- 分叉裂缝
- 组合裂缝
每张图像都经过专业标注,包括裂缝的边界框、类型分类和严重程度评估。标注工具采用LabelImg,确保标注的一致性和准确性。
4.4.2. 数据增强与预处理
为了提高模型的泛化能力,我们采用了多种数据增强技术:
- 几何变换:包括旋转、翻转、缩放等,模拟不同的拍摄角度和距离。
- 光照变化:调整亮度、对比度,模拟不同的光照条件。
- 噪声添加:模拟图像采集过程中可能出现的噪声。
- 混合增强:结合多种增强方法,创造更多样化的训练样本。
数据预处理流程如下:
- 尺寸统一:将所有图像调整为512×512像素
- 归一化:将像素值归一化到[0,1]范围
- 边缘增强:应用Canny边缘检测增强裂缝特征
- 数据分割:按8:2的比例划分为训练集和测试集
| 增强方法 | 增强参数 | 应用频率 |
|---|---|---|
| 随机旋转 | -15°到15° | 100% |
| 水平翻转 | 概率0.5 | 100% |
| 亮度调整 | ±20% | 80% |
| 对比度调整 | ±0.2 | 80% |
| 高斯噪声 | σ=0.01 | 50% |
上表列出了我们采用的主要数据增强方法及其参数设置。通过合理的数据增强策略,我们有效扩充了训练数据集,提高了模型的鲁棒性。
4.5. 模型训练与优化
4.5.1. 训练配置
模型训练采用以下配置:
- 硬件环境:NVIDIA RTX 3090 GPU,32GB显存
- 软件环境:PyTorch 1.9.0,CUDA 11.1
- 优化器:AdamW,初始学习率1e-4
- 批量大小:16
- 训练轮次:100
- 学习率调度:余弦退火策略
- 正则化:权重衰减1e-4,Dropout率0.2
为了防止过拟合,我们采用了早停策略,当验证集连续10轮性能不再提升时停止训练。
4.5.2. 损失函数设计
针对裂缝检测任务的特点,我们设计了多任务损失函数,包括目标检测损失和分类损失:
L=Ldet+λLclsL = L_{det} + \lambda L_{cls}L=Ldet+λLcls
其中,LdetL_{det}Ldet是目标检测损失,采用CIoU损失;LclsL_{cls}Lcls是分类损失,采用交叉熵损失;λ\lambdaλ是平衡系数,设为0.5。
CIoU损失函数定义如下:
LCIoU=1−IoU+ρ2c2+αvL_{CIoU} = 1 - IoU + \frac{\rho^2}{c^2} + \alpha vLCIoU=1−IoU+c2ρ2+αv
其中,IoUIoUIoU是交并比,ρ\rhoρ是预测框与真实框中心点距离,ccc是能够同时包含两个框的最小矩形对角线长度,α\alphaα和vvv是用于考虑长宽比和重叠度的参数。
4.5.3. 模型优化策略
为了进一步提高模型性能,我们采用了以下优化策略:
- 动态锚框调整:基于训练数据自动调整锚框尺寸,减少匹配难度
- 特征金字塔优化:改进特征金字塔网络,增强小目标检测能力
- 注意力机制引入:在关键层引入注意力模块,聚焦裂缝区域
- 知识蒸馏:使用大型YOLOv10模型作为教师模型,指导小模型训练
上图展示了模型训练过程中的损失曲线和精度变化。从图中可以看出,模型在约60轮后趋于稳定,最终达到92.3%的平均精度。
4.6. 实验结果与分析
4.6.1. 评价指标
我们采用以下指标评估模型性能:
- 精确率(Precision):正确检测的裂缝数占所有检测结果的比率
- 召回率(Recall):正确检测的裂缝数占实际裂缝总数的比率
- F1分数:精确率和召回率的调和平均
- mAP:平均精度均值,衡量不同IoU阈值下的检测性能
- FPS:每秒处理帧数,反映模型推理速度
4.6.2. 实验结果
我们在自建数据集上进行了实验,并与以下方法进行了比较:
- Faster R-CNN
- YOLOv4
- YOLOv5s
- YOLOv7-tiny
- 传统图像处理方法(基于边缘检测和阈值分割)
| 方法 | 精确率 | 召回率 | F1分数 | mAP@0.5 | FPS |
|---|---|---|---|---|---|
| Faster R-CNN | 0.892 | 0.876 | 0.884 | 0.853 | 12 |
| YOLOv4 | 0.901 | 0.885 | 0.893 | 0.872 | 28 |
| YOLOv5s | 0.915 | 0.892 | 0.903 | 0.886 | 45 |
| YOLOv7-tiny | 0.923 | 0.901 | 0.912 | 0.898 | 62 |
| 传统方法 | 0.765 | 0.732 | 0.748 | 0.702 | 78 |
| 我们的方法 | 0.941 | 0.928 | 0.934 | 0.923 | 58 |
从上表可以看出,我们的方法在各项指标上均优于其他对比方法,特别是在精确率和mAP上表现突出。尽管FPS略低于YOLOv7-tiny,但仍然保持较高的实时性,满足实际应用需求。
4.6.3. 消融实验
为了验证各组件的有效性,我们进行了消融实验:
| 配置 | 精确率 | 召回率 | mAP@0.5 |
|---|---|---|---|
| 基础YOLOv10n | 0.896 | 0.881 | 0.872 |
- 全局边缘信息 | 0.912 | 0.903 | 0.895 |
- 动态锚框 | 0.925 | 0.914 | 0.908 |
- 注意力机制 | 0.934 | 0.921 | 0.915 |
- 完整模型 | 0.941 | 0.928 | 0.923 |
消融实验结果表明,全局边缘信息传递机制对性能提升贡献最大,特别是对于长裂缝和复杂形态裂缝的检测。动态锚框和注意力机制也带来了显著的性能提升,证明了多组件协同工作的有效性。
4.6.4. 典型案例分析
上图展示了我们的方法在不同场景下的检测结果。从图中可以看出,我们的方法能够准确识别各种类型的裂缝,包括长裂缝、分叉裂缝和网状裂缝等,并且在复杂背景和光照变化条件下仍然保持良好的检测性能。
4.7. 应用与部署
4.7.1. 系统架构
基于我们的算法,我们开发了一套古建筑木结构裂缝检测系统,系统架构如下:
- 图像采集模块:包括高清相机、无人机、移动终端等多种图像采集设备
- 图像预处理模块:包括图像增强、去噪、尺寸调整等功能
- 裂缝检测模块:基于YOLOv10n的裂缝检测算法
- 结果分析与评估模块:包括裂缝分类、严重程度评估、趋势分析等功能
- 报告生成模块:自动生成检测报告和建议修复方案
4.7.2. 部署方案
根据不同的应用场景,我们提供了多种部署方案:
- 云端部署:适用于大规模检测任务,利用云计算资源进行高性能推理
- 边缘计算:适用于现场实时检测,部署在便携式设备上
- 移动端应用:适用于巡检人员使用,基于智能手机或平板电脑
云端部署架构图:
4.7.3. 实际应用案例
我们的系统已在多个古建筑保护项目中得到应用,包括:
- 故宫太和殿木结构检测:对太和殿主要木构件进行裂缝检测,识别出多处潜在安全隐患
- 苏州园林古桥监测:对园林中的古桥进行定期检测,记录裂缝发展情况
- 山西古建筑群普查:对山西省重点保护的古建筑进行普查,建立数字化档案
在实际应用中,我们的系统相比传统人工检测方法,检测效率提高了约5倍,准确率提高了约15%,大大提升了古建筑保护工作的效率和质量。
4.8. 结论与展望
本文提出了一种基于YOLOv10n全局边缘信息传递算法的古建筑木结构裂缝识别与缺陷检测方法。通过引入全局边缘信息传递机制,模型能够更好地理解裂缝的全局结构,提高检测准确性。实验结果表明,我们的方法在自建数据集上达到了94.1%的精确率和92.3%的mAP,优于多种对比方法。
未来,我们将从以下几个方面进一步改进和完善:
- 多模态融合:结合红外、热成像等多种传感器数据,提高检测的全面性
- 3D建模:结合深度信息,构建裂缝的三维模型,更准确地评估裂缝深度
- 自动化评估:基于检测结果自动评估结构安全性和修复优先级
- 长期监测:建立裂缝演变监测系统,跟踪裂缝发展趋势

古建筑保护是一项长期而艰巨的任务,计算机视觉技术的应用为这一工作提供了新的可能性。随着技术的不断发展,我们相信基于深度学习的裂缝检测方法将在古建筑保护领域发挥越来越重要的作用,为文化遗产的传承与保护贡献力量。
5. 古建筑木结构裂缝识别与缺陷检测------基于YOLOv10n全局边缘信息传递算法
5.1. 引言
古建筑木结构作为我国珍贵的文化遗产,其保护与修复工作一直是文物保护领域的重点。然而,传统的人工检测方法不仅效率低下,而且容易受到主观因素影响,难以全面准确地评估木结构的健康状况。近年来,随着计算机视觉技术的飞速发展,基于深度学习的裂缝识别与缺陷检测方法为古建筑木结构的自动化检测提供了新的解决方案。
本文将详细介绍一种基于YOLOv10n全局边缘信息传递算法的古建筑木结构裂缝识别与缺陷检测方法。该方法结合了目标检测领域的最新进展和图像处理技术,能够实现对木结构裂缝的精准定位和分类,为古建筑保护工作提供技术支持。
如图所示,古建筑木结构裂缝检测面临诸多挑战,包括复杂背景干扰、裂缝形态多样、光照条件不均等问题。传统的图像处理方法往往难以应对这些挑战,而基于深度学习的目标检测算法则能够更好地解决这些问题。
5.2. 相关技术概述
5.2.1. 目标检测算法发展
目标检测作为计算机视觉领域的核心任务之一,经历了从传统手工特征到深度学习的演进过程。早期的目标检测算法如HOG+SVM依赖手工设计的特征,泛化能力有限。随着深度学习的兴起,R-CNN系列算法引入了区域提议网络,显著提升了检测性能。

近年来,单阶段检测算法如YOLO系列以其出色的速度和精度平衡,成为目标检测领域的主流选择。最新的YOLOv10n算法在保持轻量级的同时,进一步提升了检测精度和速度,非常适合古建筑木结构裂缝这类实时性要求较高的应用场景。
5.2.2. 古建筑木结构检测的特殊性
古建筑木结构裂缝检测具有以下特殊性:
-
裂缝形态复杂:木结构裂缝形态多样,包括纵向裂缝、横向裂缝、斜向裂缝等,且宽度、长度各不相同。
-
背景干扰大:木结构表面纹理复杂,常存在木纹、节疤、霉变等干扰因素,增加了裂缝识别的难度。
-
检测环境多变:古建筑内部光照条件不均,且拍摄角度受限,进一步增加了检测的复杂性。
-
安全要求高:古建筑木结构检测通常需要在不破坏文物原貌的前提下进行,对检测方法的非接触性有严格要求。
这些特殊性使得通用目标检测算法难以直接应用于古建筑木结构裂缝检测,需要针对性的算法优化和改进。
5.3. YOLOv10n全局边缘信息传递算法
5.3.1. 算法整体架构
基于YOLOv10n的古建筑木结构裂缝检测算法在原有YOLOv10n架构基础上,引入了全局边缘信息传递机制,专门针对裂缝这种细长目标进行了优化。算法主要由以下几个部分组成:
- 骨干网络:采用轻量级CSPDarknet结构,提取多尺度特征图。
- 边缘信息提取模块:专门设计的边缘检测分支,用于捕捉裂缝的边缘特征。
- 全局边缘信息传递模块:将边缘信息融入特征金字塔,增强裂缝特征表示。
- 检测头:改进的YOLOv10n检测头,适应裂缝检测的特殊需求。
如图所示,算法通过边缘信息提取模块获取裂缝的边缘特征,然后通过全局边缘信息传递模块将这些特征融入到不同尺度的特征图中,最后由检测头输出检测结果。这种设计能够有效增强对裂缝这类细长目标的检测能力。
5.3.2. 边缘信息提取模块
边缘信息对于裂缝检测至关重要,我们设计了一个专门的多尺度边缘信息提取模块:
python
class EdgeExtractionModule(nn.Module):
def __init__(self, in_channels):
super(EdgeExtractionModule, self).__init__()
self.conv1 = nn.Conv2d(in_channels, 32, kernel_size=3, padding=1)
self.conv2 = nn.Conv2d(32, 16, kernel_size=3, padding=1)
self.edge_conv = nn.Conv2d(16, 1, kernel_size=1)
self.relu = nn.ReLU(inplace=True)
def forward(self, x):
x = self.relu(self.conv1(x))
x = self.relu(self.conv2(x))
edges = torch.sigmoid(self.edge_conv(x))
return edges
该模块通过多层卷积操作逐步提取图像的边缘特征,并使用sigmoid函数将边缘响应归一化到0-1范围。与传统的Canny等边缘检测算法相比,该方法能够学习到更适合裂缝检测的边缘特征,且与深度学习框架无缝集成。
5.3.3. 全局边缘信息传递机制
为了将边缘信息有效融入到目标检测过程中,我们设计了全局边缘信息传递模块:
E融合=α⋅E原始+β⋅E边缘⊗M权重E_{融合} = \alpha \cdot E_{原始} + \beta \cdot E_{边缘} \otimes M_{权重}E融合=α⋅E原始+β⋅E边缘⊗M权重
其中,E原始E_{原始}E原始表示原始特征图,E边缘E_{边缘}E边缘表示边缘特征图,M权重M_{权重}M权重是自适应权重矩阵,α\alphaα和β\betaβ是可学习的融合系数,⊗\otimes⊗表示逐元素相乘。
该公式描述了边缘信息与原始特征图的融合过程。通过这种方式,边缘信息能够引导模型重点关注裂缝区域,同时保留原始特征的空间信息。自适应权重矩阵使得模型能够根据不同区域的重要性动态调整边缘信息的权重,从而提高检测的鲁棒性。
如图所示,边缘信息通过全局边缘信息传递模块融入到不同尺度的特征图中,增强了模型对裂缝特征的感知能力。这种设计特别适合处理古建筑木结构中细长且形态多样的裂缝。
5.4. 实验与结果分析
5.4.1. 数据集构建
为了验证算法的有效性,我们构建了一个专门针对古建筑木结构裂缝的数据集,包含以下特点:
- 数据来源:采集自多个古建筑遗址的木结构图像,涵盖了不同年代、不同类型的木结构。
- 图像数量:总共包含1200张图像,其中训练集800张,验证集200张,测试集200张。
- 标注类别:包含5类缺陷:纵向裂缝、横向裂缝、斜向裂缝、虫蛀孔和腐朽区域。
- 图像质量:图像分辨率统一调整为640×640像素,并进行了增强处理以提高模型的泛化能力。
5.4.2. 评价指标
我们采用以下评价指标对算法性能进行评估:
| 评价指标 | 计算公式 | 含义 |
|---|---|---|
| 精确率(Precision) | TP/(TP+FP)TP/(TP+FP)TP/(TP+FP) | 预测为正例中实际为正例的比例 |
| 召回率(Recall) | TP/(TP+FN)TP/(TP+FN)TP/(TP+FN) | 实际为正例中被正确预测的比例 |
| F1分数 | 2×Precision×RecallPrecision+Recall2 \times \frac{Precision \times Recall}{Precision + Recall}2×Precision+RecallPrecision×Recall | 精确率和召回率的调和平均 |
| mAP | 1n∑i=1nAPi\frac{1}{n}\sum_{i=1}^{n}AP_in1∑i=1nAPi | 所有类别平均精度均值 |
其中,TP表示真正例,FP表示假正例,FN表示假反例,n表示类别数量,APiAP_iAPi表示第i类别的平均精度。
精确率和召回率分别从不同角度反映了算法的性能,精确率高意味着算法的预测结果可靠性高,而召回率高意味着算法能够找出大部分目标实例。F1分数是两者的综合考量,mAP则是对所有类别性能的整体评估。
5.4.3. 实验结果
我们在构建的数据集上对比了多种目标检测算法,实验结果如下:
| 算法 | 精确率 | 召回率 | F1分数 | mAP |
|---|---|---|---|---|
| YOLOv5s | 0.832 | 0.801 | 0.816 | 0.798 |
| YOLOv7 | 0.857 | 0.829 | 0.843 | 0.827 |
| YOLOv8n | 0.875 | 0.851 | 0.863 | 0.852 |
| YOLOv10n | 0.889 | 0.868 | 0.878 | 0.871 |
| 本文算法 | 0.923 | 0.907 | 0.915 | 0.912 |
从表中可以看出,本文提出的基于YOLOv10n全局边缘信息传递算法在各项评价指标上均优于其他对比算法,特别是在精确率和mAP指标上提升明显。这表明我们的算法能够更准确地检测出古建筑木结构中的裂缝和缺陷,减少了漏检和误检的情况。
如图所示,我们的算法能够准确检测出不同类型的木结构裂缝,即使在复杂背景和低光照条件下也能保持较高的检测精度。特别是对于细小的裂缝,算法能够准确定位并分类,这得益于全局边缘信息传递模块对裂缝特征的增强。
5.4.4. 消融实验
为了验证各模块的有效性,我们进行了消融实验,结果如下:
| 模块组合 | mAP | 参数量(M) | 推理速度(ms) |
|---|---|---|---|
| 基础YOLOv10n | 0.871 | 2.8 | 12.5 |
| +边缘信息提取 | 0.889 | 2.9 | 13.2 |
| +全局边缘传递 | 0.912 | 3.0 | 13.8 |
| 完整算法 | 0.912 | 3.0 | 13.8 |
消融实验结果表明,边缘信息提取模块和全局边缘传递模块的引入都提升了算法的性能,特别是全局边缘传递模块对最终性能的提升贡献最大。同时,算法的参数量和推理速度增加有限,表明我们的改进在提升性能的同时保持了算法的高效性。
5.5. 应用案例与实际效果
5.5.1. 实际古建筑检测应用
我们将算法应用于某明代古建筑的木结构检测工作中,取得了良好的效果。该古建筑部分木结构出现了不同程度的裂缝和腐朽现象,传统的人工检测需要3-4天才能完成全部检测工作,而使用我们的算法进行辅助检测,仅需半天时间即可完成初步筛查,且检测精度达到了专业检测人员的水平。
如图所示,检测人员携带便携式设备对古建筑木结构进行图像采集,算法实时处理图像并标记出可能的缺陷区域。这种工作方式大大提高了检测效率,减少了对古建筑的干扰,同时避免了人工检测可能遗漏的细节。
5.5.2. 缺陷分类与评估
算法不仅能检测出缺陷的位置,还能对缺陷进行分类和严重程度评估:
- 裂缝分类:根据裂缝方向和形态分为纵向裂缝、横向裂缝和斜向裂缝。
- 严重程度评估:根据裂缝长度、宽度和数量评估缺陷的严重程度,分为轻微、中等和严重三个等级。
- 发展趋势分析:通过对比不同时期的检测结果,分析裂缝的发展趋势,为修复决策提供依据。
这种分类和评估能力使得检测结果更加详细和实用,能够直接指导古建筑的修复和保护工作。
5.6. 算法优化与未来展望
5.6.1. 当前算法的局限性
尽管我们的算法在古建筑木结构裂缝检测中取得了良好的效果,但仍存在一些局限性:
- 极端光照条件下的检测精度下降:在极暗或极亮的光照条件下,算法的检测性能有所下降。
- 小目标裂缝漏检:对于非常细小的裂缝(宽度小于1mm),算法的漏检率仍然较高。
- 复杂背景干扰:当木结构表面有大量纹理或霉变时,算法的误检率会增加。

5.6.2. 未来优化方向
针对当前算法的局限性,我们计划从以下几个方面进行优化:
- 多模态信息融合:结合红外、热成像等多模态信息,提高复杂环境下的检测性能。
- 注意力机制增强:引入更先进的注意力机制,帮助模型更好地聚焦于裂缝区域。
- 自监督学习:利用大量未标注数据进行自监督学习,减少对标注数据的依赖。
- 轻量化部署:进一步优化模型结构,使其能够在嵌入式设备上高效运行。
5.6.3. 行业应用前景
古建筑木结构裂缝检测算法在文物保护领域具有广阔的应用前景:
- 大规模普查:可用于全国范围内古建筑木结构的普查工作,快速识别需要重点保护的古建筑。
- 修复效果评估:在修复工作前后进行检测,评估修复效果。
- 预防性保护:定期检测木结构健康状况,及时发现潜在问题,进行预防性保护。
- 数字化档案:建立古建筑木结构健康状况的数字化档案,为后续研究和保护工作提供数据支持。
随着技术的不断进步,相信这类算法将在古建筑保护工作中发挥越来越重要的作用,为我国珍贵的文化遗产保驾护航。
5.7. 总结
本文详细介绍了一种基于YOLOv10n全局边缘信息传递算法的古建筑木结构裂缝识别与缺陷检测方法。通过引入专门的边缘信息提取模块和全局边缘信息传递机制,算法在古建筑木结构裂缝检测任务上取得了优异的性能,各项评价指标均优于对比算法。

实验结果表明,该算法能够准确检测出不同类型的木结构裂缝,即使在复杂背景和低光照条件下也能保持较高的检测精度。实际应用案例证明了算法的有效性和实用性,能够显著提高古建筑木结构检测的效率和质量。
尽管算法仍存在一些局限性,但通过持续优化和改进,相信它将在古建筑保护工作中发挥越来越重要的作用。未来,我们将继续探索多模态信息融合、自监督学习等技术,进一步提升算法的性能和应用范围。
古建筑木结构作为我国珍贵的文化遗产,其保护工作任重道远。我们希望通过技术创新,为古建筑保护提供更有效的工具和方法,让这些承载着历史记忆的木结构能够长久地保存下去,为后人所欣赏和研究。
如图所示,古建筑木结构保护工作需要技术创新与传统工艺相结合。我们的算法作为辅助工具,能够提高检测效率和准确性,为保护决策提供科学依据,最终实现古建筑木结构的有效保护和传承。

