HIT 模式识别 手写汉字分类 Python实现

训练集数据 TrainSamples-400.csv,含 100 个不同汉字,每个汉字 400 个实例,每个实例均为 64*64 的二值图像;

训练集标注TrainSamples-400.csv,为 40000 个 0 到 99 间的整数,表示训练集中每个实例所属汉字类别;

测试集数据 TestSamples-300.csv,为 30000 个实例,每个实例格式同训练集。

要求标注测试集,输出 Result.csv。

python 复制代码
import numpy as np
import pandas as pd
from tensorflow.keras.utils import to_categorical
from tensorflow.keras import models, layers

def train():
    data = pd.read_csv("TrainSamples-400.csv", header=None)
    train_image = data.to_numpy()
    data = pd.read_csv("TrainLabels-400.csv", header=None)
    train_label = data.to_numpy()
    train_label = to_categorical(train_label)
    network = models.Sequential()
    network.add(layers.Input(shape = (64, 64, 1)))
    network.add(layers.Conv2D(64, (5, 5), activation = 'relu'))
    network.add(layers.MaxPooling2D((2, 2)))
    network.add(layers.Conv2D(96, (3, 3), activation = 'relu'))
    network.add(layers.MaxPooling2D((2, 2)))
    network.add(layers.Conv2D(48, (3, 3), activation = 'relu'))
    network.add(layers.Flatten())
    network.add(layers.Dense(768, activation = 'relu'))
    network.add(layers.Dense(100, activation = 'softmax'))
    network.summary()
    network.compile(optimizer = 'rmsprop', loss = 'categorical_crossentropy', metrics = ['accuracy'])
    network.fit(train_image.reshape(40000, 64, 64, 1), train_label, epochs = 5, batch_size = 64, validation_split = 0.1, validation_freq = 1)
    network.save('saved_model/my_model')
    
def test():
    data = pd.read_csv("TestSamples-300.csv", header = None)
    test_image = data.to_numpy()
    network = models.load_model('saved_model/my_model')
    network.summary()
    test_label = network.predict(test_image.reshape(30000, 64, 64, 1))
    test_label = np.array([np.argmax(i) for i in test_label])
    pd.DataFrame(test_label).to_csv('Result.csv', header = None, index = False)

if __name__ == '__main__':
    train()
    test()
相关推荐
wj3055853786 小时前
课程 9:模型测试记录与 Prompt 策略
linux·人工智能·python·comfyui
星寂樱易李6 小时前
iperf3 + Python-- 网络带宽、网速、网络稳定性
开发语言·网络·python
qingfeng154157 小时前
企业微信机器人开发:如何实现自动化与智能运营?
人工智能·python·机器人·自动化·企业微信
彦为君10 小时前
Agent 安全:从权限提示到沙箱隔离
python·ai·ai编程
PILIPALAPENG10 小时前
Python 语法速成指南:前端开发者视角(JS 类比版)
前端·人工智能·python
用户83562907805111 小时前
Python 操作 PowerPoint 页眉与页脚指南
后端·python
枫叶林FYL12 小时前
项目九:异步高性能爬虫与数据采集中枢 —— 基于 Crawl<sub>4</sub>AI 与 Playwright 的现代化数据采集平台 项目总览
爬虫·python·深度学习·wpf
猫猫的小茶馆12 小时前
【Python】函数与模块化编程
linux·开发语言·arm开发·驱动开发·python·stm32
Miss_min13 小时前
128K长序列数据生成
开发语言·python·深度学习