HIT 模式识别 手写汉字分类 Python实现

训练集数据 TrainSamples-400.csv,含 100 个不同汉字,每个汉字 400 个实例,每个实例均为 64*64 的二值图像;

训练集标注TrainSamples-400.csv,为 40000 个 0 到 99 间的整数,表示训练集中每个实例所属汉字类别;

测试集数据 TestSamples-300.csv,为 30000 个实例,每个实例格式同训练集。

要求标注测试集,输出 Result.csv。

python 复制代码
import numpy as np
import pandas as pd
from tensorflow.keras.utils import to_categorical
from tensorflow.keras import models, layers

def train():
    data = pd.read_csv("TrainSamples-400.csv", header=None)
    train_image = data.to_numpy()
    data = pd.read_csv("TrainLabels-400.csv", header=None)
    train_label = data.to_numpy()
    train_label = to_categorical(train_label)
    network = models.Sequential()
    network.add(layers.Input(shape = (64, 64, 1)))
    network.add(layers.Conv2D(64, (5, 5), activation = 'relu'))
    network.add(layers.MaxPooling2D((2, 2)))
    network.add(layers.Conv2D(96, (3, 3), activation = 'relu'))
    network.add(layers.MaxPooling2D((2, 2)))
    network.add(layers.Conv2D(48, (3, 3), activation = 'relu'))
    network.add(layers.Flatten())
    network.add(layers.Dense(768, activation = 'relu'))
    network.add(layers.Dense(100, activation = 'softmax'))
    network.summary()
    network.compile(optimizer = 'rmsprop', loss = 'categorical_crossentropy', metrics = ['accuracy'])
    network.fit(train_image.reshape(40000, 64, 64, 1), train_label, epochs = 5, batch_size = 64, validation_split = 0.1, validation_freq = 1)
    network.save('saved_model/my_model')
    
def test():
    data = pd.read_csv("TestSamples-300.csv", header = None)
    test_image = data.to_numpy()
    network = models.load_model('saved_model/my_model')
    network.summary()
    test_label = network.predict(test_image.reshape(30000, 64, 64, 1))
    test_label = np.array([np.argmax(i) for i in test_label])
    pd.DataFrame(test_label).to_csv('Result.csv', header = None, index = False)

if __name__ == '__main__':
    train()
    test()
相关推荐
独好紫罗兰4 分钟前
洛谷题单3-P4956 [COCI 2017 2018 #6] Davor-python-流程图重构
开发语言·python·算法
失去妙妙屋的米奇29 分钟前
Python与图像处理
图像处理·python·计算机视觉
yuanpan1 小时前
如何将python项目打包成Windows环境的exe应用提供给客户使用
开发语言·windows·python
程序员一诺1 小时前
【爬虫开发】爬虫开发从0到1全知识教程第14篇:scrapy爬虫框架,介绍【附代码文档】
后端·爬虫·python·数据
njsgcs1 小时前
python getattr调用当前文件引用的模块内的方法,实例
开发语言·python
独好紫罗兰1 小时前
洛谷题单3-P2669 [NOIP 2015 普及组] 金币-python-流程图重构
开发语言·python·算法
跳跳糖炒酸奶1 小时前
第四章、Isaacsim在GUI中构建机器人(3):添加摄像头和传感器
人工智能·python·算法·ubuntu·机器人
凯强同学2 小时前
第十四届蓝桥杯大赛软件赛省赛Python 研究生组:4.互质数的个数
python·职场和发展·蓝桥杯
utmhikari3 小时前
【日常随笔】万字长文,如何用pyside6开发一个python桌面工具
前端·python·pyqt
小杨4045 小时前
python入门系列十四(多进程)
人工智能·python·pycharm