简介
-
编程语言: Python;
-
数据集来自网络,其中包括15222张鸟类图片,分25类,依次为绿喉蜂虎(Asian_Green_Bee_Eater)、棕头拟啄木鸟(Brown_Headed_Barbet)、牛背鹭(Cattle_Egret)、普通翠鸟(Common_Kingfisher)、家八哥(Common_Myna)、普通朱雀(Common_Rosefinch)、长尾缝叶莺(Common_Tailorbird)、赤胸拟啄木鸟(Coppersmith_Barbet)、山鹡鸰(Forest_Wagtail)、灰鹡鸰(Gray_Wagtail)、戴胜(Hoopoe)、家鸦(House_Crow)、灰犀鸟(Indian_Grey_Hornbill)、印度孔雀(Indian_Peacock)、印度八色鸫(Indian_Pitta)、棕胸佛法僧(Indian_Roller)、丛林鸫鹛(Jungle_Babbler)、北方麦鸡(Northern_Lapwing)、肉垂麦鸡(Red_Wattled_Lapwing)、赤麻鸭(Ruddy_Shelduck)、小棕腹树鹊(Rufous_Treepie)、赤颈鹤(Sarus_Crane)、白胸翡翠(White_Breasted_Kingfisher)、白胸苦恶鸟(White_Breasted_Waterhen)、白鹡鸰(White_Wagtail),在项目中位于data/Birds-25文件夹内;
-
深度学习使用了ResNet18(残差神经网络,属于CNN深度卷积神经网络的一种),主要使用pytorch库进行模型构建与训练,初始阶段使用了预训练权重,测试训练轮数为20轮;
-
图像转换、预处理使用opencv、torchvision库;
-
GUI图像界面构建展示使用PyQt5库;
-
Grad-CAM热图展示感兴趣区域;
内容展示
GUI界面



代码结构

训练结果相关




