基于OpenCV与Python的身份证号码识别案例详解

import cv2
import numpy as np

# 绘图展示函数：简化图像显示流程
def cv_show(name, image):
    cv2.imshow(name, image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

# 轮廓排序函数：支持左→右、右→左、上→下、下→上
def sort_contours(cnts, method='left-to-right'):
    reverse = False
    i = 0
    if method in ['right-to-left', 'bottom-to-top']:
        reverse = True
    if method in ['top-to-bottom', 'bottom-to-top']:
        i = 1
    boundingBoxes = [cv2.boundingRect(c) for c in cnts]
    (cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),
                                        key=lambda b: b[1][i], reverse=reverse))
    return cnts, boundingBoxes

2. 模板图像预处理：生成字符匹配模板

首先处理sfzh.png（包含0-9的数字模板），提取每个数字的标准轮廓，作为后续匹配的基准。

步骤1：读取模板并转灰度/二值图

python 复制代码

# 读取模板图像
img_template = cv2.imread("sfzh.png")
cv_show('Template Image', img_template)

# 转灰度图（减少颜色通道干扰）
gray_template = cv2.imread("sfzh.png", 0)

# 二值化：反阈值化（数字变白，背景变黑）
ret, ref_bin = cv2.threshold(gray_template, 150, 255, cv2.THRESH_BINARY_INV)
cv_show('Binary Template', ref_bin)

步骤2：轮廓检测与数字排序

python 复制代码

# 查找外轮廓（仅保留数字的外边界）
_, contours, _ = cv2.findContours(ref_bin, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# 按左→右排序轮廓（确保数字顺序是0→9）
sorted_contours, _ = sort_contours(contours, method='left-to-right')

# 可视化轮廓（确认数字是否正确检测）
cv2.drawContours(img_template, sorted_contours, -1, (0, 255, 0), 2)
cv_show('Template with Contours', img_template)

步骤3：生成数字模板字典

对每个数字轮廓提取ROI（感兴趣区域），统一尺寸并存储，供后续匹配使用：

python 复制代码

digits = {}  # 存储数字模板：key=数字索引，value=标准化后的数字图像

for idx, contour in enumerate(sorted_contours):
    # 获取数字的边界框
    x, y, w, h = cv2.boundingRect(contour)
    # 提取ROI并扩展边界（避免裁剪数字）
    roi = ref_bin[y-2:y+h+2, x-2:x+w+2]
    # 统一尺寸为57×88（模板匹配的最佳尺寸）
    roi = cv2.resize(roi, (57, 88))
    # 按位取反（统一为数字黑、背景白）
    roi = cv2.bitwise_not(roi)
    # 存储模板
    digits[idx] = roi

# 关闭所有窗口
cv2.destroyAllWindows()

3. 身份证号码识别：定位→分割→匹配

接下来处理待识别的身份证图像sfz.jpg，完成号码区域的定位与字符识别。

步骤1：身份证图像预处理

python 复制代码

# 读取身份证原图
img_id = cv2.imread('sfz.jpg')
img_copy = img_id.copy()  # 用于后续绘制结果
cv_show('Original ID Card', img_id)

# 转灰度图
gray_id = cv2.imread('sfz.jpg', 0)
cv_show('Gray ID Card', gray_id)

# 二值化（阈值根据原图亮度调整）
ret, id_bin = cv2.threshold(gray_id, 120, 255, cv2.THRESH_BINARY_INV)
cv_show('Binary ID Card', id_bin)

步骤2：定位身份证号码区域

通过轮廓的位置筛选，锁定身份证底部的18位数字区域（注意：坐标范围需根据实际图像调整）：

python 复制代码

# 查找身份证图像的所有外轮廓
_, contours_id, _ = cv2.findContours(id_bin.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# 筛选号码区域：根据y坐标（330~360）和x坐标（x>220）定位底部数字
locs = []
for (i, contour) in enumerate(contours_id):
    x, y, w, h = cv2.boundingRect(contour)
    if 330 < y < 360 and x > 220:
        locs.append((x, y, w, h))

# 按x坐标排序（确保数字从左到右排列）
locs = sorted(locs, key=lambda x: x[0])

步骤3：单字符预处理与模板匹配

对每个筛选出的数字区域，进行预处理后与模板匹配，识别具体数字：

python 复制代码

output = []  # 存储最终识别结果

for (gX, gY, gW, gH) in locs:
    # 1. 提取数字区域并扩展边界
    group = gray_id[gY-2:gY+gH+2, gX-2:gX+gW+2]
    # 2. 自适应阈值（自动优化黑白对比）
    group = cv2.threshold(group, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
    # 3. 统一尺寸为模板大小（57×88）
    roi = cv2.resize(group, (57, 88))
    # 4. 按位取反（与模板格式一致）
    roi = cv2.bitwise_not(roi)
    
    # 5. 模板匹配：计算当前ROI与所有模板的相似度
    scores = []
    for digit, template in digits.items():
        # 使用TM_CCOEFF方法（值越大越匹配）
        result = cv2.matchTemplate(roi, template, cv2.TM_CCOEFF)
        (_, score, _, _) = cv2.minMaxLoc(result)
        scores.append(score)
    
    # 6. 取得分最高的模板对应的数字
    jieguo = str(np.argmax(scores))
    output.append(jieguo)
    
    # （可选）可视化识别结果：绘制矩形框与数字文本
    cv2.rectangle(img_copy, (gX-5, gY-5), (gX+gW+5, gY+gH+5), (0, 0, 255), 1)
    cv2.putText(img_copy, jieguo, (gX, gY-15),
                cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2)

步骤4：输出结果与可视化

python 复制代码

# 打印识别结果（拼接成18位身份证号）
print("识别结果：{}".format("".join(output)))

# 显示带识别标记的身份证图像
cv2.imshow('ID Card with Recognition', img_copy)
cv2.waitKey(0)
cv2.destroyAllWindows()

六、关键说明与优化方向

位置筛选的适配性 ：案例中的330<y<360和x>220是基于特定身份证图像的坐标，实际应用需根据输入图像调整（可通过调试轮廓的(x,y,w,h)可视化确认）。
模板匹配的局限性 ：若身份证图像存在旋转、缩放或光照不均，需增加角度校正 （如仿射变换）或改用深度学习模型（如CNN）提升鲁棒性。
校验位验证：识别完成后，可通过身份证校验位公式（第18位=前17位的加权和模11）验证结果合法性。

七、效果展示

运行代码后，终端会输出识别出的18位身份证号，同时窗口会显示带红色矩形框和数字标记的身份证图像（如下示例）：

复制代码

识别结果：11010119900101123X

以上就是基于OpenCV的身份证号码识别完整实现，代码可直接复现，如需优化可针对具体场景调整参数或替换识别模型~