利用sklearn工具中的train_test_split快速划分实例分割数据集

目录

1.导入相关的包

[2. 文件夹路径](#2. 文件夹路径)

3.获取所有文件的路径列表

[4. 划分数据集为训练集和测试集最终保存测试集](#4. 划分数据集为训练集和测试集最终保存测试集)

5.将进一步上面得到的训练集划分为训练集和验证集,保存训练集和验证集

6.将以上的结果保存。


1.导入相关的包
python 复制代码
import os
from sklearn.model_selection import train_test_split
2. 文件夹路径
python 复制代码
# 文件夹路径
original_images = "......\JPEGImages"
annotated_images = "......\SegmentationClass"
3.获取所有文件的路径列表
python 复制代码
original_files = [os.path.join(original_images, file) for file in os.listdir(original_images)]
annotated_files = [os.path.join(annotated_images, file) for file in os.listdir(annotated_images)]
4. 划分数据集为训练集和测试集最终保存测试集
python 复制代码
train_original, test_original, train_annotated, test_annotated = train_test_split(
    original_files, annotated_files, test_size=0.2, random_state=42)
5.将进一步上面得到的训练集划分为训练集和验证集,保存训练集和验证集
python 复制代码
train_original, val_original, train_annotated, val_annotated = train_test_split(
    train_original, train_annotated, test_size=0.1, random_state=42)
6.将以上的结果保存。
相关推荐
u0109272718 分钟前
持续集成/持续部署(CI/CD) for Python
jvm·数据库·python
lixin55655616 分钟前
基于迁移学习的图像风格增强器
java·人工智能·pytorch·python·深度学习·语言模型
byzh_rc18 分钟前
[数学建模从入门到入土] 评价模型
网络·人工智能·深度学习·数学建模·回归·ar
阡陌..22 分钟前
浅谈SAR图像处理---形态学滤波
图像处理·人工智能·python
renhongxia129 分钟前
多机器人环境监测中的异质性,用于解决时间冲突任务
人工智能·信息可视化·语言模型·自然语言处理·数据分析·机器人
源于花海44 分钟前
迁移学习的第三类方法:子空间学习(2)——流形学习
人工智能·机器学习·迁移学习·流形学习·子空间学习
方安乐1 小时前
杂记:文档解析器之MinerU
人工智能
AI猫站长1 小时前
快讯|星海图、众擎机器人、魔法原子释放IPO信号,2026年或成上市大年
人工智能·机器人·具身智能·灵心巧手·上市·星海图·众擎机器人
鲁邦通物联网1 小时前
基于容器化的边缘计算网关应用部署实践:Python+MQTT
人工智能·边缘计算·数据采集·工业数据采集·边缘计算网关·5g数采
方安乐1 小时前
杂记:文档解析器
人工智能