百度木木浆测试

本程序测试识别图片的文字

import cv2

from paddleocr import PaddleOCR, draw_ocr

from matplotlib import pyplot as plt

加载PaddleOCR模型,这里你可以根据需要选择语言和模型路径

ocr = PaddleOCR(use_gpu=False, lang='ch') # 假设我们识别中文字符,并且不使用GPU

读取图像

img = cv2.imread("car.jpg")

缩放图像(如果需要)

img = cv2.resize(img, (int(img.shape1 * 0.5), int(img.shape0 * 0.5)))

将BGR图像转换为灰度图像(如果需要OCR前的预处理,但PaddleOCR通常处理BGR图像)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

显示灰度图像(通常这不是OCR的必要步骤,但在这里只是为了展示)

fig = plt.figure(figsize=(6, 6))

plt.imshow(gray, cmap='gray'), plt.axis('off'), plt.title("Grayscale Image")

plt.show()

使用PaddleOCR进行OCR

result = ocr.ocr(img, use_gpu=False)

在原图上绘制OCR结果

from PIL import Image

image = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB)) # 转换为RGB格式,因为PIL使用RGB

boxes = line\[0 for line in result]

txts = line\[10 for line in result]

scores = line\[11 for line in result]

im_show = draw_ocr(image, boxes, txts, scores, font_path='./doc/fonts/simfang.ttf')

im_show = np.array(im_show) # 将PIL图像转换为numpy数组

显示带有OCR结果的图像

plt.figure(figsize=(12, 6))

plt.imshow(cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)) # 再次转换为RGB以在matplotlib中显示

plt.axis('off')

plt.title("OCR Result")

plt.show()

相关推荐
菜鸟‍6 小时前
【论文学习】Segment Anything 分割一切
深度学习·学习·计算机视觉
全栈开发圈7 小时前
作者有话说|关于目标检测
人工智能·目标检测·计算机视觉
硅谷秋水10 小时前
NVIDIA OmniDreams:用于闭环自动驾驶仿真、支持实时生成的世界模型
人工智能·深度学习·机器学习·计算机视觉·自动驾驶
AI棒棒牛10 小时前
YOLO26 全网独家改进创新: MIT 2025 振荡状态空间模型:引入可学习的阻尼机制,独家创新!
人工智能·学习·目标检测·计算机视觉·yolo26
m沐沐11 小时前
【计算机视觉】OpenCV 模板匹配银行卡数字识别---上
人工智能·后端·python·opencv·计算机视觉·pycharm·numpy
却道天凉_好个秋13 小时前
HEVC(十四):再谈RDO
计算机视觉·hevc·码率控制·rdo
大江东去浪淘尽千古风流人物13 小时前
【MASt3R-SLAM】从DUSt3R到MASt3R-SLAM:基于3D重建先验的实时稠密SLAM系统演进与深度解析
计算机视觉·数学建模·参数化模型·smpl·手部重建·mano·3d手部模型
AI人工智能+13 小时前
基于深度学习的医疗机构执业许可证识别技术通过智能图像处理、目标检测和语义理解,实现关键信息的高精度提取与结构化转换
深度学习·计算机视觉·自然语言处理·ocr·医疗机构执业许可证识别
Chenyu_31013 小时前
世界模型:从“预测下一个状态”到“可交互世界模拟器”
人工智能·计算机视觉·交互
盼小辉丶15 小时前
视觉Transformer实战 | Twins空间注意力机制详解与实现
深度学习·计算机视觉·transformer