基于opencv和PaddleOCR识别身份证信息

1、安装组件

pip install --upgrade paddlepaddle paddleocr

2、完整code

python 复制代码
import cv2
import numpy as np
from paddleocr import PaddleOCR

# 初始化 PaddleOCR
use_angle_cls=True, lang="ch", det_db_thresh=0.1, det_db_box_thresh=0.5)


def preprocess_image(image_path):
    """
    使用 OpenCV 对图像进行预处理
    :param image_path: 图像路径
    :return: 预处理后的图像
    """
    # 读取图像
    image = cv2.imread(image_path)
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)  # 转换为灰度图像
    blurred = cv2.GaussianBlur(gray, (5, 5), 0)  # 高斯模糊去噪
    _, binary = cv2.threshold(
        blurred, 128, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU
    )  # 二值化
    return binary


def recognize_id_card(image_path):
    """
    识别身份证信息
    :param image_path: 身份证图像路径
    :return: 识别结果
    """
    # 预处理图像
    preprocessed_image = preprocess_image(image_path)

    # 将预处理后的图像转换为 PaddleOCR 需要的格式
    img = cv2.cvtColor(preprocessed_image, cv2.COLOR_GRAY2BGR)

    # 使用 PaddleOCR 进行文字识别
    result = ocr.ocr(img, cls=True)
    print(result)
    # 提取识别结果
    for line in result:
        for elem in line:
            print(elem[-1][0])  # 打印识别的文本内容


# 示例:识别一张身份证图像
recognize_id_card("card.jpg")

3、调整 PaddleOCR 参数

如果某些图像无法识别,可以尝试调整 PaddleOCR 的参数,例如检测阈值、识别模型等。

ocr = PaddleOCR(use_angle_cls=True, lang="ch", det_db_thresh=0.3, det_db_box_thresh=0.6)

说明:

1、det_db_thresh

• 作用:文字检测的阈值。该参数控制检测算法的灵敏度,值越低,检测到的文字区域越多,但误检率也越高。

• 默认值: 0.3

• 范围: 0.0 到 1.0

• 建议:如果检测到的文字区域太少,可以尝试降低该值;如果检测到的区域太多且包含大量误检,可以提高该值。

2、 det_db_box_thresh

• 作用:文字区域的过滤阈值。该参数用于过滤掉低置信度的检测结果,值越高,保留的检测结果越少。

• 默认值: 0.6

• 范围: 0.0 到 1.0

• 建议:如果检测到的文字区域中有大量误检,可以提高该值;如果检测到的区域太少,可以降低该值。

相关推荐
Hua-Jay11 小时前
OpenCV联合C++/Qt 学习笔记(二十二)----相机模型与投影及单目相机标定
c++·笔记·qt·opencv·学习·计算机视觉
sali-tec13 小时前
C# 基于OpenCv的视觉工作流-章74-线-线距离
图像处理·人工智能·opencv·算法·计算机视觉
问窗13 小时前
计算机视觉入门案例 高速公路车辆计数系统技术解析
python·opencv·计算机视觉
爱炸薯条的小朋友1 天前
全局锁的性能优势,以及链路优化为何常常低于预期——基于 `MatPoolsTest` 中小图池与大图池的实战复盘
opencv·算法·c#
m0_617493941 天前
OpenCV报错解决:cornerSubPix断言失败 src.channels() == 1 的终极指南
人工智能·opencv·计算机视觉
weixin_307779132 天前
OCR图片文本提取代码
图像处理·python·opencv·自动化·ocr
勤自省2 天前
ROS2 + OpenCV 实战教程:人脸识别、物体跟踪、ArUco 二维码识别初级
人工智能·opencv·ubuntu·计算机视觉·ros2
爱炸薯条的小朋友2 天前
C#的详细应用和讲解池化为什么能提升 OpenCvSharp / Mat 的整体效率
开发语言·opencv·c#
欲儿2 天前
magicCamera——利用相机识别纸牌并替换为特定纸牌
opencv·ar·安卓开发·轮廓检测·纸牌识别
AI玫瑰助手2 天前
PDF 转 Markdown 主力方案怎么选:PaddleOCR-VL-1.5、MinerU、HunyuanOCR 与 MonkeyOCR 实测对比
pdf·大模型·知识库·表格·md·文字识别·paddleocr