我的Dify OCR 识别发票准确率测试工具

RPA流程机器人项目上开始用Dify中的千问vl模型识别承兑票据,来帮助财务专员加快上账流程审批速度。在Dify中,我们有一个智能体,它只有很简单的一步,就是OCR识别,其实千问全量模型的识别率已经非常高了,但是为了做到100%的识别率和测试达成100%的识别率,我们需要不断优化这个智能体的提示词。这个过程是一个体力活,所以博主开发了批量测试工具来帮忙。

工具使用.net8 开发,所以执行文件有点大,带一个配置文件,文件中填入访问Dify的url和app ID.

批量调用工具的说明如下:

1、选择目录,选择后,该目录中的文件名称会加载到左边的列表。点击一个文件,准备OCR。

2、点击OCR识别按钮,一次发出10个识别请求给Dify,返回信息放在"结果"列表中。

3、程序在10个线程完成后,自动核对结果,如果错一个字,就会提示不同。

4、清空文本按钮可以手动清空每次返回的结果和核对结果列表。

有了这个工具,批量测试后,再去调整提示词,效率会高很多。

工具下载,中国移动云盘:

链接: https://yun.139.com/shareweb/#/w/i/2qidExRaKSirq

提取码:adoo

相关推荐
@解忧杂货铺19 小时前
【百度AI】Postman调用OCR服务-解决官方教程请求失败问题
ocr
远上寒山19 小时前
DeepSeek-OCR 论文精读与实践:用“光学上下文压缩”把长文本变成图片,再由 VLM 高效还原
ocr·vllm·文档解析·deepseek·deepseek-ocr·视觉-文本压缩
翔云 OCR API1 天前
身份证三要素实名核验API:基于OCR与可信身份认证的技术解析
ocr
AI人工智能+3 天前
服务器端护照识别技术:通过图像预处理、OCR字符识别和智能分析实现高效身份核验
人工智能·深度学习·ocr·护照识别
Eiceblue3 天前
Python 快速提取扫描件 PDF 中的文本:OCR 实操教程
vscode·python·ocr·1024程序员节
之墨_3 天前
【LLM】用 FastAPI 搭建「OpenAI 兼容」DeepSeek-OCR 服务 + 简洁WebUI
大模型·ocr·deepseek-ocr
小白狮ww3 天前
dots.ocr 基于 1.7B 参数实现多语言文档处理,性能达 SOTA
人工智能·深度学习·机器学习·自然语言处理·ocr·小红书·文档处理
xunan0033 天前
DeepSeek-OCR MoE结构梳理(其它LLM原理类似)
ocr
机器学习是魔鬼4 天前
在矩池云上如何使用DeepSeek-OCR
ocr·矩池云·deepseek-ocr