4步OpenCV-----扫秒身份证号

这段代码用 OpenCV 做了一份"数字模板字典",然后在银行卡/身份证照片里自动找到身份证号那一行,把每个数字切出来跟模板比对,最终输出并高亮显示出完整的身份证号码,下面是代码解释:

模块 1 工具箱(通用函数)

目的:

  • cv_show:调试时弹窗查看中间图像

  • sort_contours:按指定顺序(左→右、上→下等)排列轮廓,避免 OpenCV 随机顺序

代码

复制代码
def cv_show(name, image):
    cv2.imshow(name, image)
    cv2.waitKey(0)

def sort_contours(cnts, method='left-to-right'):
    reverse = False
    i = 0
    if method in ('right-to-left', 'bottom-to-top'):
        reverse = True
    if method in ('top-to-bottom', 'bottom-to-top'):
        i = 1
    boundingBoxes = [cv2.boundingRect(c) for c in cnts]
    (cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),
                                        key=lambda b: b[1][i],
                                        reverse=reverse))
    return cnts, boundingBoxes

注意

  • 返回值为元组,后续用 [0] 取排序后的轮廓

  • 若数字多行,可将 method 改为 'top-to-bottom'


模块 2 模板制作(生成 0-9 标准模板)

目的

从干净模板图中切出单个数字 → 统一尺寸(57×88)→ 白底黑字,供后续模板匹配

步骤

  1. 读图

    复制代码
    img = cv2.imread("picture/TP.png")
    gray = cv2.imread("picture/TP.png", 0)
  2. 二值化(数字变白)

    复制代码
    ref = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY_INV)[1]
  3. 找轮廓并排序

    复制代码
    _, refCnts, _ = cv2.findContours(ref, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    refCnts = sort_contours(refCnts, method='left-to-right')[0]
  4. 生成模板字典

    复制代码
    digits = {}
    for (i, c) in enumerate(refCnts):
        x, y, w, h = cv2.boundingRect(c)
        roi = ref[y-2:y+h+2, x-2:x+w+2]
        roi = cv2.resize(roi, (57, 88))
        roi = cv2.bitwise_not(roi)  # 白底黑字
        digits[i] = roi

注意

  • 模板图需无粘连、无干扰

  • 若含小数点/空格,需额外过滤以保证 digits 长度为 10


模块 3 输入图预处理(定位身份证号区域)

目的

在整幅银行卡/身份证中,仅保留"身份证号"水平条带,减少误检

步骤

  1. 读图

    复制代码
    img = cv2.imread('picture/card_id.jpg')
    gray = cv2.imread('picture/card_id.jpg', 0)
  2. 二值化

    复制代码
    ref = cv2.threshold(gray, 120, 255, cv2.THRESH_BINARY_INV)[1]
  3. 找轮廓

    复制代码
    _, refCnts, _ = cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
  4. 几何过滤(针对当前图写死坐标)

注意

  • 330/360/220 为经验值,换图需调整

  • 光照不均时建议自适应阈值或亮度归一化


模块 4 单字符切割 + 模板匹配识别

目的

将单行 ROI 切成单个字符,与模板库 0-9 匹配,得分最高者即为识别结果,并绘制边框与文字

步骤

  • 遍历每个候选矩形

    复制代码
    output = []
    for (i, (gX, gY, gW, gH)) in enumerate(locs):
        group = gray[gY-2:gY+gH+2, gX-2:gX+gW+2]
        group = cv2.threshold(group, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
        roi = cv2.resize(group, (57, 88))
  • 模板匹配打分

    复制代码
    scores = []
    for (digit, digitROI) in digits.items():
        result = cv2.matchTemplate(roi, digitROI, cv2.TM_CCOEFF)
        (_, score, _, _) = cv2.minMaxLoc(result)
        scores.append(score)
    jieguo = str(np.argmax(scores))
    output.append(jieguo)
  • 绘制结果

    复制代码
    cv2.rectangle(imgg, (gX-5, gY-5), (gX+gW+5, gY+gH+5), (0, 0, 255), 1)
    cv2.putText(imgg, jieguo, (gX, gY-15), cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2)
  • 打印整串号码

    复制代码
    print("Card ID #: {}".format("".join(output)))
    cv2.imshow("Image", imgg)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

注意

  • 若印刷为黑底白字,需再次 bitwise_not

  • 仅支持数字 0-9;含字母/X 需扩展模板或改用 CNN

  • 连体数字需先投影分割再识别

相关推荐
deepxuan9 分钟前
Day1--python三大库-Pandas
人工智能·python·pandas
嫂子的姐夫11 分钟前
042-spiderbuf第C7题
爬虫·python·逆向
2403_8355684720 分钟前
自然语言处理(NLP)入门:使用NLTK和Spacy
jvm·数据库·python
剑穗挂着新流苏31225 分钟前
Pytorch加载数据
python·深度学习·transformer
阿泽·黑核25 分钟前
Easy Vibe Coding 学习心得(二):从产品原型到 AI 应用——我的第一个完整项目
人工智能·ai编程·vibe coding
qq_4523962326 分钟前
【Python × AI】多智能体协作:从 AutoGPT 到 CrewAI 的组织进化论
大数据·人工智能·python·ai
老李的森林41 分钟前
杂谈--如何与AI高效率的对话
人工智能·stm32·嵌入式硬件·机械
guhy fighting1 小时前
pycharm 切换版本和窗口cmd看到的版本不一致问题解决
ide·python·pycharm
码农三叔1 小时前
(10-5-03)大模型时代的人形机器人感知:基于RoboBrain大模型的人形机器人通用智能感知系统(3)模型训练
人工智能·机器学习·机器人·人形机器人
陈天伟教授1 小时前
人工智能应用- 预测新冠病毒传染性:04. 中国:强力措施遏制疫情
前端·人工智能·安全·xss·csrf