用 Go 和 TensorFlow 实现图像验证码识别系统

验证码识别是一项实用的图像识别任务。虽然深度学习主流工具大多基于 Python,但在生产环境中,Go 语言以其高性能和简洁性,常用于构建后端服务。本文将演示如何使用 Go 加载 TensorFlow 模型并实现验证码图片识别。

1. 准备模型(Python 部分)

由于 Go 本身不擅长训练模型,我们可以用 Python 和 TensorFlow/Keras 训练一个 CNN 模型,并保存为 .pb 格式。

Python 示例代码(训练后保存模型):
登录后复制

plain 复制代码
# train_and_export.py
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
import tensorflow as tf

model = Sequential([
    Conv2D(32, (3,3), activation='relu', input_shape=(60,160,1)),
    MaxPooling2D(2,2),
    Conv2D(64, (3,3), activation='relu'),
    MaxPooling2D(2,2),
    Flatten(),
    Dense(128, activation='relu'),
    Dense(4 * 36, activation='softmax')  # 4位验证码,每位36类(0-9A-Z)
])
更多内容访问ttocr.com或联系1436423940
model.compile(optimizer='adam', loss='categorical_crossentropy')
# 假设你已经完成训练...

# 保存模型
tf.saved_model.save(model, "saved_model/captcha_model")

注意:这里保存的是 TensorFlow 2.x 的 SavedModel 格式,Go 可直接读取。


2. 安装 Go TensorFlow 库

登录后复制

plain 复制代码
go get github.com/tensorflow/tensorflow/tensorflow/go

确保你已安装 TensorFlow C 库(例如使用 conda 或 apt 安装)。


3. 加载模型并预测验证码

登录后复制

plain 复制代码
package main

import (
	"fmt"
	"image"
	"io/ioutil"
	"os"

	tf "github.com/tensorflow/tensorflow/tensorflow/go"
	"github.com/nfnt/resize"
	_ "image/png"
)

func preprocessImage(imagePath string) (*tf.Tensor, error) {
	file, err := os.Open(imagePath)
	if err != nil {
		return nil, err
	}
	defer file.Close()

	img, _, err := image.Decode(file)
	if err != nil {
		return nil, err
	}

	resized := resize.Resize(160, 60, img, resize.Lanczos3)
	// 转换为灰度 + float32 + 正则化
	data := make([]float32, 160*60)
	i := 0
	for y := 0; y < 60; y++ {
		for x := 0; x < 160; x++ {
			r, g, b, _ := resized.At(x, y).RGBA()
			gray := float32((r + g + b) / 3 >> 8)
			data[i] = gray / 255.0
			i++
		}
	}

	// 构建 Tensor
	tensor, err := tf.NewTensor([1][60][160][1]float32{})
	if err != nil {
		return nil, err
	}
	copy(tensor.Value().([1][60][160][1]float32)[0][:][0][:], data)
	return tensor, nil
}

func main() {
	model, err := tf.LoadSavedModel("saved_model/captcha_model", []string{"serve"}, nil)
	if err != nil {
		panic(err)
	}
	defer model.Session.Close()

	input, err := preprocessImage("captcha_samples/A7K9_1.png")
	if err != nil {
		panic(err)
	}

	result, err := model.Session.Run(
		map[tf.Output]*tf.Tensor{
			model.Graph.Operation("serving_default_input_1").Output(0): input,
		},
		[]tf.Output{
			model.Graph.Operation("StatefulPartitionedCall").Output(0),
		},
		nil,
	)
	if err != nil {
		panic(err)
	}

	// 输出预测
	prediction := result[0].Value().([][]float32)[0]
	alphabet := "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ"
	fmt.Print("Predicted: ")
	for i := 0; i < 4; i++ {
		// 每个字符有36个概率值
		offset := i * 36
		maxIdx := 0
		maxVal := float32(0)
		for j := 0; j < 36; j++ {
			if prediction[offset+j] > maxVal {
				maxVal = prediction[offset+j]
				maxIdx = j
			}
		}
		fmt.Print(string(alphabet[maxIdx]))
	}
	fmt.Println()
}
相关推荐
风象南1 小时前
我把大脑开源给了AI
人工智能·后端
橙序员小站6 小时前
Agent Skill 是什么?一文讲透 Agent Skill 的设计与实现
前端·后端
怒放吧德德6 小时前
Netty 4.2 入门指南:从概念到第一个程序
java·后端·netty
雨中飘荡的记忆8 小时前
大流量下库存扣减的数据库瓶颈:Redis分片缓存解决方案
java·redis·后端
开心就好20259 小时前
UniApp开发应用多平台上架全流程:H5小程序iOS和Android
后端·ios
悟空码字9 小时前
告别“屎山代码”:AI 代码整洁器让老项目重获新生
后端·aigc·ai编程
小码哥_常9 小时前
大厂不宠@Transactional,背后藏着啥秘密?
后端
奋斗小强9 小时前
内存危机突围战:从原理辨析到线上实战,彻底搞懂 OOM 与内存泄漏
后端
小码哥_常10 小时前
Spring Boot接口防抖秘籍:告别“手抖”,守护数据一致性
后端
心之语歌10 小时前
基于注解+拦截器的API动态路由实现方案
java·后端