前言
paddleocr是百度飞桨的一个文字识别库,准确度非常高,基于其文字识别的基础,将其用于车牌识别。这个识别的准确度是相当高的。
环境配置
系统:windows
平台:visual studio code
语言:python
库:paddleocr、pyqt5
相关博客链接
1、<Python><paddleocr>基于python使用百度paddleocr实现图片文字识别与替换
2、<tesseract><opencv><Python>基于python和opencv,使用ocr识别图片中的文本并进行替换
paddleocr
需要先安装paddle库:
python
pip install paddlepaddle
pip install paddleocr
安装完成后,导入PaddleOCR:
python
from paddleocr import PaddleOCR
使用很简单:
python
ocr=PaddleOCR(use_angle_cls=True) # 需要安装 paddlepaddle-gpu >= 2.0 or paddlepaddle >= 2.0
re1=ocr.ocr(imgfile,cls=True)
re1即ocr识别的结果,包含了识别文本的位置值、文本内容以及准确度。
对于文本,假设图片上除了车牌外,还有其他文本,那么我们需要将车牌的格式单独提取出来,可以使用re来进行匹配:
python
pattern=r'[\u4e00-\u9fa5][A-Z][-·]?[A-Z0-9]{5}'
matches=re.findall(pattern,text)
上面的pattern识别车牌格式为:皖A ·12345或者皖A-12345。
实例演示:
paddleocr识别车牌演示