变电站缺陷数据集8307张,带xml标注和txt标注,可以直接用于yolo训练

变电站缺陷数据集8307张,

带xml标注和txt标注,可以直接用于yolo训练,赠附五个脚本

变电站缺陷数据集

数据集概述

变电站缺陷数据集是一个专门针对变电站设备和环境缺陷检测的图像数据集。该数据集包含了8307张经过标注的图像,旨在通过机器学习和计算机视觉技术来识别和分类变电站中的各种缺陷,如设备损坏、异常行为等。数据集同时提供了XML和TXT两种标注格式,可以直接用于YOLO系列目标检测模型的训练。

数据集特点
  1. 全面性:数据集涵盖了变电站设备的各种缺陷类型,包括但不限于设备损坏、异常行为等。
  2. 详细标注:每张图像都带有详细的标注信息,包括对象的类别、边界框坐标等。
  3. 兼容性强:提供了XML和TXT两种标注格式,既适合传统的基于XML的标注方式,也方便YOLO模型的直接使用。
  4. 实用性:数据集可以直接应用于变电站的安全监控和设备维护,帮助及时发现并处理潜在的安全隐患。
数据集构成
  • 图像数量:8307张
  • 标注格式
    • XML格式:适用于多种基于XML的标注工具和模型训练。
    • TXT格式:适用于YOLO系列目标检测模型的训练。
数据集用途
  • 缺陷检测:用于训练和测试识别变电站中设备缺陷的算法。
  • 安全监控:在实际应用中,可以用于自动化监控变电站设备的状态,及时发现并处理安全隐患。
  • 故障预防:帮助电力部门提前预警,减少由于设备缺陷导致的事故风险。
  • 研究与开发:为研究人员提供一个基准数据集,用于比较不同算法的效果。
  • 教育与培训:作为教学资源,帮助学生理解计算机视觉和机器学习的基本概念。
数据集获取

变电站缺陷数据集可以从相关的科研机构、数据提供商或者通过开源社区获取。获取数据集时,请遵循数据集发布的许可协议,确保合法使用。

示例代码

下面是一个简单的示例代码,展示了如何使用Python加载和预览变电站缺陷数据集中的图像及其XML格式的标注信息。

1import os
2import random
3import xml.etree.ElementTree as ET
4import matplotlib.pyplot as plt
5from PIL import Image
6
7# 数据集目录路径
8data_dir = 'path/to/transformer_station_defect_dataset'
9image_dir = os.path.join(data_dir, 'images')
10annotation_dir = os.path.join(data_dir, 'annotations_xml')
11
12# 随机选择一张图像
13image_files = os.listdir(image_dir)
14image_file = random.choice(image_files)
15image_path = os.path.join(image_dir, image_file)
16
17# 加载图像
18image = Image.open(image_path)
19
20# 加载XML标注
21xml_file = os.path.splitext(image_file)[0] + '.xml'
22xml_path = os.path.join(annotation_dir, xml_file)
23tree = ET.parse(xml_path)
24root = tree.getroot()
25
26# 绘制边界框
27fig, ax = plt.subplots(1, figsize=(10, 10))
28ax.imshow(image)
29ax.axis('off')
30
31for obj in root.findall('object'):
32    bbox = obj.find('bndbox')
33    xmin = int(bbox.find('xmin').text)
34    ymin = int(bbox.find('ymin').text)
35    xmax = int(bbox.find('xmax').text)
36    ymax = int(bbox.find('ymax').text)
37    label = obj.find('name').text
38    
39    ax.add_patch(plt.Rectangle((xmin, ymin), xmax - xmin, ymax - ymin, edgecolor='r', facecolor='none'))
40    ax.text(xmin, ymin, label, color='r', fontsize=8)
41
42plt.show()
YOLO标注格式转换

如果您需要将XML格式的标注转换为YOLO所需的TXT格式,可以使用以下Python代码示例:

1import os
2import xml.etree.ElementTree as ET
3
4# 数据集目录路径
5data_dir = 'path/to/transformer_station_defect_dataset'
6annotation_dir_xml = os.path.join(data_dir, 'annotations_xml')
7annotation_dir_yolo = os.path.join(data_dir, 'annotations_yolo')
8
9if not os.path.exists(annotation_dir_yolo):
10    os.makedirs(annotation_dir_yolo)
11
12# 类别映射字典
13class_map = {
14    'defect_type_1': 0,  # 替换为实际的类别名和索引
15    'defect_type_2': 1,
16    # 添加更多的类别
17}
18
19for xml_file in os.listdir(annotation_dir_xml):
20    if not xml_file.endswith('.xml'):
21        continue
22    
23    tree = ET.parse(os.path.join(annotation_dir_xml, xml_file))
24    root = tree.getroot()
25    
26    image_width = int(root.find('size/width').text)
27    image_height = int(root.find('size/height').text)
28    
29    with open(os.path.join(annotation_dir_yolo, os.path.splitext(xml_file)[0] + '.txt'), 'w') as f:
30        for obj in root.findall('object'):
31            label = obj.find('name').text.lower().strip()
32            if label in class_map:
33                class_id = class_map[label]
34                
35                bbox = obj.find('bndbox')
36                xmin = int(bbox.find('xmin').text)
37                ymin = int(bbox.find('ymin').text)
38                xmax = int(bbox.find('xmax').text)
39                ymax = int(bbox.find('ymax').text)
40                
41                x_center = (xmin + xmax) / 2.0
42                y_center = (ymin + ymax) / 2.0
43                w = xmax - xmin
44                h = ymax - ymin
45                
46                x_center /= image_width
47                y_center /= image_height
48                w /= image_width
49                h /= image_height
50                
51                f.write(f"{class_id} {x_center:.6f} {y_center:.6f} {w:.6f} {h:.6f}\n")

总结

此变电站缺陷数据集是一个高质量的数据集,涵盖了变电站设备的多种缺陷类型。数据集的特点是全面性、详细标注和兼容性强,能够满足不同研究需求。通过使用该数据集,研究者可以在变电站安全监控和设备维护领域推动技术进步,提高工作效率和安全性。

相关推荐
命里有定数19 小时前
Ubuntu问题 - 显示ubuntu服务器上可用磁盘空间 一条命令df -h
服务器·ubuntu·数据集
数据猎手小k2 天前
PCBS:由麻省理工学院和Google联合创建,揭示1.2M短文本间的相似性的大规模图聚类数据集。
机器学习·支持向量机·数据集·聚类·机器学习数据集·ai大模型应用
数据猎手小k5 天前
DAHL:利用由跨越 29 个类别的 8,573 个问题组成的基准数据集,评估大型语言模型在生物医学领域长篇回答的事实准确性。
人工智能·深度学习·语言模型·数据集·机器学习数据集·ai大模型应用
此星光明9 天前
GEE 数据集——美国gNATSGO(网格化国家土壤调查地理数据库)完整覆盖了美国所有地区和岛屿领土的最佳可用土壤信息
javascript·数据库·数据集·美国·数据·gee·土壤
OpenBayes9 天前
OpenBayes 一周速览丨VASP 教程上线!HPC 助力材料计算;AllClear 公共云层去除数据集发布,含超 23k 个全球分布的兴趣区域
人工智能·深度学习·机器学习·自然语言处理·开源·数据集·大语言模型
数据猎手小k12 天前
CulturalBench :一个旨在评估大型语言模型在全球不同文化背景下知识掌握情况的基准测试数据集
数据集·机器学习数据集·ai大模型应用
此星光明13 天前
2016年7月29日至2017年2月21日NASA大气层层析(ATom)任务甲醛(HCHO)、羟基(OH)和OH生产率的剖面积分柱密度
数据集·甲醛·nasa·羟基·密度·剖面·hcho
数据猎手小k13 天前
GS-Blur数据集:首个基于3D场景合成的156,209对多样化真实感模糊图像数据集。
数据集·机器学习数据集·ai大模型应用
HyperAI超神经13 天前
贝式计算的 AI4S 观察:使用机器学习对世界进行感知与推演,最大魅力在于横向扩展的有效性
人工智能·深度学习·机器学习·数据集·ai4s·科研领域·工科
HyperAI超神经15 天前
突破1200°C高温性能极限!北京科技大学用机器学习合成24种耐火高熵合金,室温延展性极佳
人工智能·深度学习·机器学习·数据集·ai4s·材料学·合金