百度木木浆测试

本程序测试识别图片的文字

import cv2

from paddleocr import PaddleOCR, draw_ocr

from matplotlib import pyplot as plt

加载PaddleOCR模型,这里你可以根据需要选择语言和模型路径

ocr = PaddleOCR(use_gpu=False, lang='ch') # 假设我们识别中文字符,并且不使用GPU

读取图像

img = cv2.imread("car.jpg")

缩放图像(如果需要)

img = cv2.resize(img, (int(img.shape[1] * 0.5), int(img.shape[0] * 0.5)))

将BGR图像转换为灰度图像(如果需要OCR前的预处理,但PaddleOCR通常处理BGR图像)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

显示灰度图像(通常这不是OCR的必要步骤,但在这里只是为了展示)

fig = plt.figure(figsize=(6, 6))

plt.imshow(gray, cmap='gray'), plt.axis('off'), plt.title("Grayscale Image")

plt.show()

使用PaddleOCR进行OCR

result = ocr.ocr(img, use_gpu=False)

在原图上绘制OCR结果

from PIL import Image

image = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB)) # 转换为RGB格式,因为PIL使用RGB

boxes = [line[0] for line in result]

txts = [line[1][0] for line in result]

scores = [line[1][1] for line in result]

im_show = draw_ocr(image, boxes, txts, scores, font_path='./doc/fonts/simfang.ttf')

im_show = np.array(im_show) # 将PIL图像转换为numpy数组

显示带有OCR结果的图像

plt.figure(figsize=(12, 6))

plt.imshow(cv2.cvtColor(im_show, cv2.COLOR_BGR2RGB)) # 再次转换为RGB以在matplotlib中显示

plt.axis('off')

plt.title("OCR Result")

plt.show()

相关推荐
武子康4 小时前
AI研究-116 特斯拉 HW3.0 与 HW4.0 区别详解:摄像头分辨率、FSD算力、雷达与Vision泊车
人工智能·深度学习·计算机视觉·ai·自动驾驶·汽车·视觉检测
Mrliu__4 小时前
Opencv(六) : 颜色识别
人工智能·opencv·计算机视觉
努力犯错4 小时前
Google Veo 3.1 提示词生成器:让 AI 视频创作效率翻倍的免费工具
人工智能·计算机视觉·语言模型·开源·音视频
武子康6 小时前
AI研究-117 特斯拉 FSD 视觉解析:多摄像头 - 3D占用网络 - 车机渲染,盲区与低速复杂路况安全指南
人工智能·科技·计算机视觉·3d·视觉检测·特斯拉·model y
AndrewHZ6 小时前
【图像处理基石】如何在图像中实现光晕的星芒效果?
图像处理·opencv·计算机视觉·cv·图像增强·算法入门·星芒效果
你也渴望鸡哥的力量么7 小时前
基于边缘信息提取的遥感图像开放集飞机检测方法
人工智能·计算机视觉
sali-tec9 小时前
C# 基于halcon的视觉工作流-章54-N点标定
开发语言·图像处理·算法·计算机视觉·c#
深度学习lover11 小时前
<项目代码>yolo织物缺陷识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·织物缺陷识别·项目代码
夕阳染色的坡道13 小时前
LineSlam线特征投影融合(Fuse) 中pML->GetLineNormalVector()的理解代码理解
人工智能·opencv·计算机视觉
音视频牛哥15 小时前
RTMP/RTSP/WebRTC/SRT/HLS/DASH/GB28181/WebTransport/QUIC协议规范深度分析
人工智能·计算机视觉·音视频·webrtc·大牛直播sdk·dash·webtransport