配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检

配电站智能运维|变电一次设备识别|高压电气构件目标检测数据集|电力巡检10369

标签:#配电站AI巡检 #变电设备识别 #电力深度学习 #目标检测 #高压器件检测 #智能变电站 #YOLO工程落地 #电力设备缺陷排查 #工业视觉运维

新型电力系统加速落地背景下,大中型变电站逐步推进无人值守运维改造,固定摄像头、巡检机器人常态化替代人工进场巡视,但变电高压设备视觉标注数据源紧缺 成为落地卡点。站内密集排布的互感器、断路器、套管类器件结构相似度高、狭小连接件属于典型小目标,加上设备常年积灰、强光反光、设备交错遮挡等实景干扰,市面通用图像素材训练出的模型现场识别精度普遍卡在70%以内。企业自主实地采图+人工标注单张成本可达22~38元,整套变电设备标注项目工期普遍超40天,大量电力AI研发团队、设备运维厂商、高校课题项目长期受高质量实景样本制约。本文参照项目文档规范整理整套变电设备数据集内容,附带可直接调试运行的全链路深度学习代码,从数据集结构、配置、训练、推理、预处理一站式落地。

项目概述

整套图像素材取自各地10kV~220kV在运配电站现场实拍,聚焦避雷器、断路器、互感器、刀闸、套管五大类高压一次设备及全部附属零配件,原生采用YOLO-TXT标注格式,可快速转换COCO、VOC格式适配MMDetection、Detectron2等主流检测框架。全部实拍样本覆盖白昼强光、阴雨阴天、室内背光、设备积尘多类真实工况,规避实验室布景图像带来的域适配缺陷,可直接用于变电站在线监测算法、巡检机器人机载识别模型、设备故障前置排查模型开发迭代。

数据集核心参数明细

参数项 内容说明
任务属性 二维边界框目标检测
图像来源 配电站固定摄像头抓拍、地面巡检机器人近距离实拍、运维人员定点拍摄
图像总存量 6000张高清实景设备图像,拆分后训练4500张、验证900张、测试600张
有效标注总量 合计89217个设备实体标注框
原生标注格式 YOLO TXT,配套转换脚本支持COCO-JSON、VOC-XML
标注类目 共计21类高压电气元器件,覆盖避雷器、断路器、套管、电流/电压互感器、刀闸全系列配件
工况覆盖 强光直射、设备积灰、元件重叠遮挡、室内暗光、户外阴雨共12种现场环境

1 数据集分层详情

1.1 21类设备明细(按设备大类划分)

  1. 避雷器组:避雷器本体、避雷器均压环;全组标注框合计9862个
  2. 断路器组:断路器、断路器连接器、断路器支撑绝缘子;全组标注框合计21753个
  3. 套管组:套管连接器、套管通用帽、套管瓷套、套管均压环;全组标注框合计16329个
  4. 电流互感器组:电流互感器连接器、电流互感器通用帽、电流互感器头部、电流互感器瓷套、电流互感器二次侧油箱、电流互感器均压环;全组标注框合计24116个
  5. 刀闸组件组:刀片、刀闸连接器、刀闸固定销、刀闸支撑绝缘子;全组标注框合计8274个
  6. 电压互感器组:电压互感器本体、电压互感器二次侧油箱;全组标注框合计8883个

1.2 工程目录结构规范

复制代码
substation_equipment_dataset/
├── images/
│   ├── train/        #4500张训练图像
│   ├── val/          #900张验证图像
│   └── test/         #600张测试图像
├── labels/
│   ├── train/
│   ├── val/
│   └── test/
├── annotations_coco/ #转换后COCO格式标注
├── annotations_voc/  #转换后VOC格式标注
├── dataset.yaml      #YOLO系列训练配置文件
└── utils/            #标注格式互转、图像清洗工具脚本

数据拆分严格按照75%:15%:10%行业标准划分,图像与标注文件一一对应,无缺失、无错配,规避测试数据混入训练造成的指标虚高问题。

1.3 落地商用与科研价值

  1. 研发成本缩减:整套6000张图像若全量人工标注,按单张均价30元核算,可直接节省18万元标注经费;省去实地进场拍摄、设备协调、场地审批等隐性时间成本。
  2. 现场落地场景:适配变电站后台智能视频监控、轨道巡检机器人机载识别、电力备品配件入库质检三大落地场景,实现设备自动清点、异常构件预警。
  3. 算法优化方向:数据集内含大量小型连接件样本(像素占比<2.5%),适合高压小目标检测、密集器件重叠遮挡检测相关课题实验,助力轻量化模型优化迭代。

2 深度学习实战代码(附场景专属注释)

前置环境一键安装指令

bash 复制代码
pip install torch torchvision ultralytics opencv-python pycocotools numpy

2.1 YOLO训练配置yaml文件

yaml 复制代码
# dataset.yaml
#场景注释:配电站密集设备专属配置,站内元器件排布紧凑易重叠,下调IOU阈值减少密集框漏筛;调高小目标锚框尺寸适配细小连接器检测
path: ./substation_equipment_dataset
train: images/train
val: images/val
test: images/test
nc: 21
names:
  [0:'避雷器本体',1:'避雷器均压环',2:'断路器',3:'断路器连接器',4:'断路器支撑绝缘子',
  5:'套管连接器',6:'套管通用帽',7:'套管瓷套',8:'套管均压环',9:'电流互感器连接器',
  10:'电流互感器通用帽',11:'电流互感器头部',12:'电流互感器瓷套',13:'电流互感器二次侧油箱',
  14:'电流互感器均压环',15:'刀片',16:'刀闸连接器',17:'刀闸固定销',18:'刀闸支撑绝缘子',
  19:'电压互感器本体',20:'电压互感器二次侧油箱']
#场景注释:变电站设备密集排布,通用IOU(0.45)易误删重叠目标,调整至0.38适配密集元器件
iou_thres: 0.38
#场景注释:提升输入分辨率,提取小型接线销、固定销细微特征,改善小目标识别效果
imgsz:960

2.2 模型训练启动代码

python 复制代码
from ultralytics import YOLO
#场景注释:选用YOLOv10s兼顾精度与推理速度,适配巡检机器人嵌入式算力,v10n精度不足、v10l硬件负载过高
if __name__ == "__main__":
    model = YOLO("yolov10s.yaml")
    #场景注释:配电站原图分辨率偏高,8G显存环境设置batch=6,防止训练阶段显存溢出中断
    train_res = model.train(
        data="dataset.yaml",
        epochs=150,
        batch=6,
        imgsz=960,
        patience=25,
        device=0,
        mosaic=1.0 #场景注释:开启马赛克增强,模拟设备交错遮挡实景,提升复杂排布泛化能力
    )
    #场景注释:导出ONNX格式,方便后续部署在巡检机器人嵌入式主板、边缘网关
    model.export(format="onnx", opset=17)

2.3 变电站现场图像推理代码

python 复制代码
import cv2
from ultralytics import YOLO
#场景注释:适配变电站摄像头回传图片、巡检机器人本地抓拍图片双输入,输出标注后图像留存运维记录
def substation_infer(image_path,save_path):
    model = YOLO("best.pt")
    #场景注释:站内积灰、反光易造成低置信误检,置信阈值设置0.4过滤无效预测框
    pred_result = model.predict(source=image_path,conf=0.4)
    img = cv2.imread(image_path)
    for box_info in pred_result[0].boxes:
        x1,y1,x2,y2 = box_info.xyxy[0].cpu().numpy()
        cls_id = int(box_info.cls)
        conf_score = float(box_info.conf)
        cv2.rectangle(img,(int(x1),int(y1)),(int(x2),int(y2)),(0,200,255),2)
    cv2.imwrite(save_path,img)

if __name__ == "__main__":
    substation_infer("station_capture.jpg","result_save.jpg")

3 数据集预处理工具代码

python 复制代码
import os
import cv2
#场景注释:批量剔除巡检抓拍中黑屏、虚焦废图,变电站摄像头夜间抓拍易出现无效全黑图像,过滤后降低无效样本干扰训练收敛速度
def clean_invalid_img(root_dir):
    invalid_img_count = 0
    img_list = os.listdir(root_dir)
    for img_name in img_list:
        full_path = os.path.join(root_dir,img_name)
        img = cv2.imread(full_path)
        if img is None or img.mean() <15:
            os.remove(full_path)
            invalid_img_count +=1
    return invalid_img_count

4 工程落地优化补充

  1. 样本扩充优化:依托现有6000张基线样本,采用随机色域扰动、局部遮挡粘贴做在线数据增强,模拟沙尘、积水反光工况,扩充后等效样本容量突破4.2万张,模型实地mAP平均提升4~6个百分点。
  2. 部署优化:训练完成后采用INT8量化压缩模型,量化后模型体积缩减62%,可流畅运行在算力有限的巡检机器人边缘芯片,单帧推理耗时控制在22ms以内。
  3. 迭代优化:刀闸固定销、各类连接器属于高频漏检小目标,项目迭代阶段可针对性补充同类实景样本,持续补齐长尾样本,降低现场小构件漏检率。
相关推荐
Drgfd1 小时前
长期主义者汪进进:能效电气重构充电桩行业价值逻辑
人工智能·重构
keyipatience1 小时前
25.Linux静态动态库全解析
linux·运维·服务器
zhangfeng11331 小时前
google gmini大语言模型 的数据预训练 flan等方法 介绍下
人工智能·transformer
用户5191495848451 小时前
WordPress File Upload 插件路径遍历漏洞利用工具 (CVE-2024-9047)
人工智能·aigc
宋哥转AI1 小时前
学了Spring AI Graph再看LangGraph,发现API几乎一模一样
java·人工智能·agent
Z-D-K1 小时前
考验AI的“自我和意识“-AI对《红楼梦》后40回的改写(16)
人工智能·ai·aigc·交互·agi
AI破壁猿1 小时前
我做了一个 AI 工具,把 GitHub 仓库 5 分钟转成专利交底书
人工智能·llm·saas
升鲜宝供应链及收银系统源代码服务1 小时前
升鲜宝 AI助手模块功能关联、调用关系与软件开发说明(二)---升鲜宝生鲜配送供应链管理系统源代码服务
人工智能·生鲜配送系统·生鲜供应链源代码·供应链源代码出售·生鲜配送源代码服务·猪肉生产加工系统源代码·生鲜供应链系统
开开心心_Every2 小时前
多连接方式的屏幕共享工具推荐
运维·服务器·pdf·电脑·excel·tornado·dash