无需联网,使用python调用离线版微信OCR模块,快速文字识别

首先感谢52破解的这篇帖子,【windows 微信OCR离线版】无需联网准确快速实现文字识别 - 吾爱破解 - 52pojie.cn

原作者是使用aardio语言写的桌面应用,以下根据原作者的aardio代码,将核心功能翻译成了python版本

微信OCR离线模块地址:wwko.lanzoue.com/iEbys2rrmm4... 密码:h9bc

python 复制代码
pip install wechat-ocr
python 复制代码
import os, json, time
from wechat_ocr.ocr_manager import OcrManager, OCR_MAX_TASK_ID

wechat_ocr_dir = os.path.abspath(r"./wxocr/WeChatOCR.exe")
wechat_dir = os.path.abspath(r"./wxocr")

def ocr_result_callback(img_path:str, results:dict):
    result_file = os.path.basename(img_path) + ".json"
    print(f"识别成功,img_path: {img_path}, result_file: {result_file}")
    with open(result_file, 'w', encoding='utf-8') as f:
       f.write(json.dumps(results, ensure_ascii=False, indent=2))

def main():
    ocr_manager = OcrManager(wechat_dir)
    # 设置WeChatOcr目录
    ocr_manager.SetExePath(wechat_ocr_dir)
    # 设置微信所在路径
    ocr_manager.SetUsrLibDir(wechat_dir)
    # 设置ocr识别结果的回调函数
    ocr_manager.SetOcrResultCallback(ocr_result_callback)
    # 启动ocr服务
    ocr_manager.StartWeChatOCR()
    #以上为本地OCR服务初始化

    # 开始识别图片
    ocr_manager.DoOCRTask(os.path.abspath(r".JPG/ocr_screenshot.jpg"))
    time.sleep(1)
    while ocr_manager.m_task_id.qsize() != OCR_MAX_TASK_ID:
        pass
    # 识别输出结果
    ocr_manager.KillWeChatOCR()
    
if __name__ == "__main__":
    main()

识别之后会输出一个json结果

里面会包含识别结果和每个结果对应原始图片的坐标位置

相关推荐
SoaringHeart21 分钟前
Flutter组件封装:标签拖拽排序 NDragSortWrap
前端·flutter
zeijiershuai23 分钟前
Vue 工程化、ElementPlus 快速入门、ElementPlus 常见组件-表格组件、ElementPlus常见组件-分页条组件
前端·javascript·vue.js
q***098026 分钟前
Spring Boot 2.7.x 至 2.7.18 及更旧的版本,漏洞说明
java·spring boot·后端
程序员爱钓鱼29 分钟前
Python 编程实战 · 进阶与职业发展:数据分析与 AI(Pandas、NumPy、Scikit-learn)
后端·python·trae
程序员爱钓鱼42 分钟前
Python 编程实战 · 进阶与职业发展:Web 全栈(Django / FastAPI)
后端·python·trae
漫天黄叶远飞43 分钟前
把原型链画成地铁图:坐 3 站路就能看懂 JS 的“继承”怎么跑
前端·javascript
bank_dreamer1 小时前
VSCODE前端代码风格格式化
前端·css·vscode·html·js·prettier·代码格式化
IT_陈寒1 小时前
90%的Python开发者不知道:这5个内置函数让你的代码效率提升300%
前端·人工智能·后端
网络点点滴1 小时前
Vue3的生命周期
前端·javascript·vue.js