整治PPOCRLabel中cv2文件读取问题(更新中)

PPOCRLabel

  • 使用PPOCRLabel对ocr预标注结果进行纠正
  • 由于PaddleOCR代码库十分混乱,路径经常乱掉pip和代码库的代码,经常报错,ocr也是使用paddleocr的pip包;
安装
shell 复制代码
pip install PPOCRLabel==2.1.3
启动
shell 复制代码
PPOCRLabel --lang ch

修改记录

修改1:
  • 报错:AttributeError: 'NoneType' object has no attribute 'shape'
angular2html 复制代码
'NoneType' object has no attribute 'shape'
Traceback (most recent call last):
  File "D:\ProgramData\Anaconda3\envs\paddle\lib\site-packages\PPOCRLabel\libs\autoDialog.py", line 41, in run
    h, w, _ = cv2.imdecode(np.fromfile(Imgpath, dtype=np.uint8), 1).shape
AttributeError: 'NoneType' object has no attribute 'shape'
  • 原因:cv2不支持读取带有中文字符路径文件
python 复制代码
  h, w, _ = cv2.imdecode(np.fromfile(Imgpath, dtype=np.uint8), 1).shape
  • 解决:使用PIL替换cv2, 将上述代码替换为
python 复制代码
# 修改文件:"D:\ProgramData\Anaconda3\envs\paddle\lib\site-packages\PPOCRLabel\libs\autoDialog.py", line 41
# 增加PIL读取图片函数
from PIL import Image
def load_image(image_path: str, return_chw: bool = True, size: tuple = None):
    image = Image.open(image_path).convert("RGB")
    if size is not None:
        image = image.resize(size)  # resize image
    image = np.asarray(image)
    image = image[:, :, ::-1]  # flip color channels from RGB to BGR
    w, h = image.shape[1], image.shape[0]  # update size after resize
    if return_chw:
        image = image.transpose(2, 0, 1)
    return image, (w, h)

# 替换上面代码
try:
    image_data, (w, h) = load_image(Imgpath, return_chw=False)
except Exception as e:
    print(f"load file {Imgpath} fail!")
    continue
修改2
  • 报错:AttributeError: 'NoneType' object has no attribute 'shape'
python 复制代码
Traceback (most recent call last):
  File "D:\ProgramData\Anaconda3\envs\paddle\lib\site-packages\PPOCRLabel\PPOCRLabel.py", line 1889, in saveFile
    self._saveFile(imgidx, mode=mode)
  File "D:\ProgramData\Anaconda3\envs\paddle\lib\site-packages\PPOCRLabel\PPOCRLabel.py", line 1934, in _saveFile
    self.openNextImg()
  File "D:\ProgramData\Anaconda3\envs\paddle\lib\site-packages\PPOCRLabel\PPOCRLabel.py", line 1880, in openNextImg
    self.loadFile(filename)
  File "D:\ProgramData\Anaconda3\envs\paddle\lib\site-packages\PPOCRLabel\PPOCRLabel.py", line 1550, in loadFile
    height, width, depth = cvimg.shape
AttributeError: 'NoneType' object has no attribute 'shape'
  • 原因还是cv2不能读取中文路径文件
  • 解决:
python 复制代码
# 修改: File "D:\ProgramData\Anaconda3\envs\paddle\lib\site-packages\PPOCRLabel\PPOCRLabel.py", line 1550, in loadFile
# cvimg = cv2.imdecode(np.fromfile(unicodeFilePath, dtype=np.uint8), 1)
cvimg, _ = load_image(unicodeFilePath, return_chw=False)
修改3
  • 报错:error: (-215:Assertion failed) _src.total() > 0 in function 'cv::warpPerspective'

    • 报错描述:在对PPOCRLABEL的框进行重新识别是,发生如下报错:

      复制代码
      Can not recognise the detection box in xxxx,png. Please change manually'

      unicodeFilePath is J:\data\mllm-data\xxxxxxxxx\wKh2CWERPJOAY2x-AAE62o598k0620.png
      OpenCV(4.2.0) C:\projects\opencv-python\opencv\modules\imgproc\src\imgwarp.cpp:3143: error: (-215:Assertion failed) _src.total() > 0 in function 'cv::warpPerspective'

    • 原因是我们的ocr预标注数据Label.txt是使用PIL读取图片数据,调用ppocr进行生产的(并不是在PPOCRLabel工具内部生产的), 当我们修改数据框后, PPOCRLabel尝试再次使用cv2进行读取原图,此时由于cv2对路径较为敏感,经常会读取文件失败,才会出现如上情况

  • 解决:

    依旧是修改PPOCRLabel源码, 把cv2读取改为PIL读取,就不惯着cv2的臭毛病...

python 复制代码
# 修改如下代码
 def reRecognition(self):
    #img = cv2.imdecode(np.fromfile(self.filePath,dtype=np.uint8),1)
    img, _ = load_image(self.filePath, return_chw=False)
相关推荐
见行AGV机器人1 小时前
无人机脉动线中的AGV小车
人工智能·无人机·agv·非标定制agv
廋到被风吹走1 小时前
【AI】从 OpenAI Codex 到 GitHub Copilot:AI 编程助手的技术演进脉络
人工智能·github·copilot
newsxun1 小时前
DHA之后,大脑营养进入GPC时代?
人工智能
sg_knight1 小时前
设计模式实战:模板方法模式(Template Method)
python·设计模式·模板方法模式
程序员Better1 小时前
2026年AI大模型选择指南:8大主流模型深度对比,小白秒懂如何选!
人工智能
FreakStudio1 小时前
ESP32居然能当 DNS 服务器用?内含NCSI欺骗和DNS劫持实现
python·单片机·嵌入式·面向对象·并行计算·电子diy
ai_xiaogui1 小时前
AIStarter新版后端原型图详解:架构全面升级+共享环境一键部署,本地AI模型插件工作流管理新时代来临(2026开发者必看)
人工智能·架构·推动开源ai落地·原型图细节·aistarter新版·aistarter新版原型图·架构全面升级+共享环境一键部署
2501_926978332 小时前
“LLM的智能本质--AGI的可能路径--人类的意识本质”三者的统一基底(5.0理论解读)
人工智能·经验分享·笔记·深度学习·机器学习·ai写作·agi
拾光向日葵2 小时前
2026贵州高职专科报考全问答合集:专业、就业与实力大盘点
大数据·人工智能·物联网
لا معنى له2 小时前
WAM与AC-WM:具身智能时代的世界动作模型与动作条件世界模型
人工智能·笔记·学习