利用sklearn工具中的train_test_split快速划分实例分割数据集

目录

1.导入相关的包

[2. 文件夹路径](#2. 文件夹路径)

3.获取所有文件的路径列表

[4. 划分数据集为训练集和测试集最终保存测试集](#4. 划分数据集为训练集和测试集最终保存测试集)

5.将进一步上面得到的训练集划分为训练集和验证集,保存训练集和验证集

6.将以上的结果保存。


1.导入相关的包
python 复制代码
import os
from sklearn.model_selection import train_test_split
2. 文件夹路径
python 复制代码
# 文件夹路径
original_images = "......\JPEGImages"
annotated_images = "......\SegmentationClass"
3.获取所有文件的路径列表
python 复制代码
original_files = [os.path.join(original_images, file) for file in os.listdir(original_images)]
annotated_files = [os.path.join(annotated_images, file) for file in os.listdir(annotated_images)]
4. 划分数据集为训练集和测试集最终保存测试集
python 复制代码
train_original, test_original, train_annotated, test_annotated = train_test_split(
    original_files, annotated_files, test_size=0.2, random_state=42)
5.将进一步上面得到的训练集划分为训练集和验证集,保存训练集和验证集
python 复制代码
train_original, val_original, train_annotated, val_annotated = train_test_split(
    train_original, train_annotated, test_size=0.1, random_state=42)
6.将以上的结果保存。
相关推荐
数据要素X2 分钟前
【数据架构06】可信数据空间架构篇
大数据·运维·数据库·人工智能·架构
道可云4 分钟前
道可云人工智能每日资讯|浙江省人民政府印发《关于支持人工智能创新发展的若干措施》
人工智能·百度
waterHBO9 分钟前
安装 tensorflow-2.10.0 支持 gpu
人工智能·python·tensorflow
pk_xz12345614 分钟前
python 实现一个完整的基于Python的多视角三维重建系统,包含特征提取与匹配、相机位姿估计、三维重建、优化和可视化等功能
开发语言·python·数码相机
闭月之泪舞14 分钟前
OpenCv高阶(十四)——LBPH人脸识别
人工智能·opencv·计算机视觉
南隅。15 分钟前
【Python】开发工具uv
python·uv
FanfanPyt25 分钟前
Python打卡训练营学习记录Day34
开发语言·python·学习
糖葫芦君27 分钟前
Better & Faster Large Language Models via Multi-token Prediction 原理
人工智能
人工智能培训28 分钟前
计算机视觉设计开发工程师学习路线
人工智能·学习·计算机视觉·大模型·transformer·ai大模型
ywyy679840 分钟前
「短剧系统开发」定制化技术架构|高并发微服务 + AI 推荐,快速搭建流量级短剧平台
大数据·网络·人工智能·小程序·短剧·短剧系统·短剧系统开发