注:本系列博客在于汇总CSDN的精华帖,类似自用笔记,不做学习交流,方便以后的复习回顾,博文中的引用都注明出处,并点赞收藏原博主.
目录
VGG的数据集处理
1.数据的分类
对于收集到的数据分成三类,分别用于测试,训练和验证,训练和验证集的大小差不多在8:3左右,放在同一文件夹下。
2.对数据集的处理
将数据进行分类的放在对应的文件夹下。
同时对所有数据生成一个csv文件,记录各个数据的路径和分类标签,具体生成方法自行上网查找,这里不在一一赘述。
VGG的分类标签设置
在根目录写一个json文件,用来表示分类编号,具体如图所示。
对于如何写一个json文件,可以新建一个记事本文件,写完后保存格式改为json即可。
小结
1.对于数据集的处理非常重要,直接影响到能否使模型成功训练
2.数据集可以从网上下载,也可以使用爬虫拔取数据