利用sklearn工具中的train_test_split快速划分实例分割数据集

目录

1.导入相关的包

[2. 文件夹路径](#2. 文件夹路径)

3.获取所有文件的路径列表

[4. 划分数据集为训练集和测试集最终保存测试集](#4. 划分数据集为训练集和测试集最终保存测试集)

5.将进一步上面得到的训练集划分为训练集和验证集,保存训练集和验证集

6.将以上的结果保存。


1.导入相关的包
python 复制代码
import os
from sklearn.model_selection import train_test_split
2. 文件夹路径
python 复制代码
# 文件夹路径
original_images = "......\JPEGImages"
annotated_images = "......\SegmentationClass"
3.获取所有文件的路径列表
python 复制代码
original_files = [os.path.join(original_images, file) for file in os.listdir(original_images)]
annotated_files = [os.path.join(annotated_images, file) for file in os.listdir(annotated_images)]
4. 划分数据集为训练集和测试集最终保存测试集
python 复制代码
train_original, test_original, train_annotated, test_annotated = train_test_split(
    original_files, annotated_files, test_size=0.2, random_state=42)
5.将进一步上面得到的训练集划分为训练集和验证集,保存训练集和验证集
python 复制代码
train_original, val_original, train_annotated, val_annotated = train_test_split(
    train_original, train_annotated, test_size=0.1, random_state=42)
6.将以上的结果保存。
相关推荐
云境筑桃源哇1 分钟前
亿迈跨境分销商城启航
大数据·人工智能
梯度下降中4 分钟前
Softmax与交叉熵手撕
人工智能·机器学习
咕噜企业分发小米8 分钟前
GPUStack × MaxKB:打造强大易用的开源企业级智能体平台(下)
人工智能
WitsMakeMen8 分钟前
RoPE 算法原理?算法为什么只和相对位置有关
人工智能·算法·llm
热点速递28 分钟前
理想汽车“寒冬”未退,业绩小幅回暖掩盖深层阵痛
人工智能·汽车·业界资讯
有Li31 分钟前
基于几何映射的二维自然图像到四维fMRI脑图像的迁移学习/文献速递-大模型与图像分割在医疗影像中应用
人工智能·深度学习·文献·医学生
学而要时习32 分钟前
拒绝 API 堆砌:当“AI 龙虾”打破传统软件工程的确定性边界
人工智能·软件工程
weixin_5051544633 分钟前
Bowell Studio:重塑工业互联网时代的装配制造与运维检修
运维·数据库·人工智能·制造·数字孪生·3d产品配置器·3d交互展示
sa1002736 分钟前
淘宝商品详情 API 接口开发实战:item_detail 调用、参数与 Python 示例
linux·数据库·python
八角Z44 分钟前
AI短视频创作实战心得:从玩具到生产力工具亲测
人工智能·机器学习·服务发现·音视频