GPT编程(1)八分类图像数据集转换为二分类

一个核心问题就是要将这八类数据图片全部重命名,尝试了一步到位

有一个图像数据集,有八个类别'amusement','anger','awe','contentment','disgust',' excitement', 'fear','sadness'的图片,每张图片被命名为"类别+数字"。采用遍历的方式,按顺序阅读每一张图片,将其中'amusement','anger','awe','contentment'四个类别文件夹的图片重新命名为"positive+n",这里的n是阅读到的次序,每一张图片都有单独的次序号,并单独放在一个文件夹中;将,'disgust',' excitement', 'fear','sadness'四个类别文件夹的图片重新命名为"negetive+n",这里的n是阅读到的次序,每一张图片都有单独的次序号,并单独放在文件夹中。用python来实现这个功能,并打印一个进度条来显示进度。

但是读取每一个类别都会重置positive序号,导致出错。所以分为了两步:(1)将八类数据图片放在两个文件夹中,先不改名称;(2)用上面的方法,给所有图片改名称

1)将八类数据图片放在两个文件夹中,先不改名称;

有一个data文件夹中有八个存放图片的类别文件夹,分别是'amusement','anger','awe','contentment','disgust',' excitement', 'fear','sad',读取这些文件夹中的图片,将'amusement','anger','awe','contentment'这四个文件夹中的图片放进"positive"文件夹中,将'disgust',' excitement', 'fear','sadness'并将文件中的图片这四个文件夹中的图片放进"negetive"文件夹中。用python实现这个功能,并打印一个进度条来显示进度。

python 复制代码
import os
from tqdm import tqdm

# 定义输入文件夹和输出文件夹的路径
input_folder = 'your_dataset_folder'
output_folder_positive = 'positive_images'
output_folder_negative = 'negative_images'

# 创建输出文件夹
os.makedirs(output_folder_positive, exist_ok=True)
os.makedirs(output_folder_negative, exist_ok=True)

# 定义类别列表
positive_categories = ['amusement', 'anger', 'awe', 'contentment']
negative_categories = ['disgust', 'excitement', 'fear', 'sadness']

# 遍历每个类别文件夹
for category in positive_categories + negative_categories:
    category_folder = os.path.join(input_folder, category)

    # 确保类别文件夹存在
    if os.path.exists(category_folder):
        # 使用tqdm显示进度条
        for i, filename in enumerate(tqdm(os.listdir(category_folder), desc=f"Processing {category}")):
            file_path = os.path.join(category_folder, filename)

            # 确保是文件而不是文件夹
            if os.path.isfile(file_path):
                # 确定输出路径和新文件名
                if category in positive_categories:
                    output_path = os.path.join(output_folder_positive, f"positive_{i+1}.jpg")
                else:
                    output_path = os.path.join(output_folder_negative, f"negative_{i+1}.jpg")

                # 复制文件到新文件夹并重新命名
                os.rename(file_path, output_path)

print("处理完成。")

(2)用上面的方法,给所有图片改名称

有一个data文件夹中有八个存放图片的类别文件夹,分别是'amusement','anger','awe','contentment','disgust',' excitement', 'fear','sad',读取这些文件夹中的图片,将'amusement','anger','awe','contentment'这四个文件夹中的图片放进"positive"文件夹中,将'disgust',' excitement', 'fear','sadness'并将文件中的图片这四个文件夹中的图片放进"negetive"文件夹中。用python实现这个功能,并打印一个进度条来显示进度。

python 复制代码
import os
from tqdm import tqdm
import shutil

# 定义输入文件夹和输出文件夹的路径
input_folder = 'data'
output_folder_positive = 'positive'
output_folder_negative = 'negative'

# 创建输出文件夹
os.makedirs(output_folder_positive, exist_ok=True)
os.makedirs(output_folder_negative, exist_ok=True)

# 定义类别列表
positive_categories = ['amusement', 'anger', 'awe', 'contentment']
negative_categories = ['disgust', 'excitement', 'fear', 'sad']

# 遍历每个类别文件夹
for category in positive_categories + negative_categories:
    category_folder = os.path.join(input_folder, category)
    
    # 确保类别文件夹存在
    if os.path.exists(category_folder):
        # 使用tqdm显示进度条
        for filename in tqdm(os.listdir(category_folder), desc=f"Processing {category}"):
            file_path = os.path.join(category_folder, filename)
            
            # 确保是文件而不是文件夹
            if os.path.isfile(file_path):
                # 确定输出路径和新文件名
                if category in positive_categories:
                    output_path = os.path.join(output_folder_positive, filename)
                else:
                    output_path = os.path.join(output_folder_negative, filename)
                
                # 复制文件到新文件夹
                shutil.copy(file_path, output_path)

print("处理完成。")

(3)把上述二分类数据集按照80:15:5划分为训练集,测试集,验证集

有一个图像数据集,有两个类别文件夹'positive','negative',按照80:15:5划分为训练集,测试集,验证集,分别放在"train","test","val"文件夹中,在每个文件夹中的从"positive"获得的图片放在'positive'文件夹中,从"negative"获得的图片放在'negative'文件夹中,举例文件夹'train'的下一级是文件夹"positive"和文件夹"negative"。用python来实现这个功能,并打印一个进度条来显示进度。

python 复制代码
import os
import random
from shutil import copyfile
from tqdm import tqdm

def split_and_copy_images(input_folder, output_folder, split_ratios=(0.8, 0.15, 0.05), seed=42):
    random.seed(seed)

    # 创建输出文件夹
    for split in ['train', 'test', 'val']:
        split_path = os.path.join(output_folder, split)
        os.makedirs(os.path.join(split_path, 'positive'), exist_ok=True)
        os.makedirs(os.path.join(split_path, 'negative'), exist_ok=True)

    # 遍历每个类别的文件夹
    for category in ['positive', 'negative']:
        category_path = os.path.join(input_folder, category)
        image_files = os.listdir(category_path)
        random.shuffle(image_files)

        # 划分数据集
        total_files = len(image_files)
        train_count = int(total_files * split_ratios[0])
        test_count = int(total_files * split_ratios[1])

        # 复制文件到相应的文件夹
        for i, filename in enumerate(tqdm(image_files, desc=f"Processing {category}")):
            src_path = os.path.join(category_path, filename)

            if i < train_count:
                dst_path = os.path.join(output_folder, 'train', category, f'{category}_{i + 1}.jpg')
            elif i < train_count + test_count:
                dst_path = os.path.join(output_folder, 'test', category, f'{category}_{i + 1}.jpg')
            else:
                dst_path = os.path.join(output_folder, 'val', category, f'{category}_{i + 1}.jpg')

            copyfile(src_path, dst_path)

# 输入文件夹和输出文件夹路径
input_folder = 'path/to/dataset'
output_folder = 'path/to/split_dataset'

# 划分数据集并显示进度条
split_and_copy_images(input_folder, output_folder)
print("数据集划分完成。")

总结,如果思路清晰,有些脚本用ChatGPT来写还是非常方便的。

相关推荐
剑穗挂着新流苏31239 分钟前
115_PyTorch 实战:从零搭建 CIFAR-10 完整训练与测试流水线
人工智能·pytorch·深度学习·神经网络
Veggie2639 分钟前
【Java深度学习】PyTorch On Java 系列课程 第八章 17 :模型评估【AI Infra 3.0】[PyTorch Java 硕士研一课程]
java·人工智能·深度学习
妄汐霜1 小时前
小白学习笔记(spring框架的aop和tx)
笔记·学习
sheeta19982 小时前
LeetCode 每日一题笔记 日期:2025.03.24 题目:2906.构造乘积矩阵
笔记·leetcode·矩阵
gregmankiw3 小时前
Nemotron架构(Mamba3+Transformer+Moe)
android·深度学习·transformer
椎4953 小时前
JSONUtil工具包大致学习使用
学习
乐分启航3 小时前
SliMamba:十余K参数量刷新SOTA!高光谱分类的“降维打击“来了
java·人工智能·深度学习·算法·机器学习·分类·数据挖掘
leiming63 小时前
CAN 通信协议学习讲义(带图文 + C 语言代码)
c语言·开发语言·学习
Heartache boy3 小时前
野火STM32_HAL库版课程笔记-ADC多通道采集热敏、光敏、反射传感器(轮询)
笔记·stm32·单片机
yoothey4 小时前
Java字节流与字符流核心笔记(问答+考点复盘)
java·开发语言·笔记