Windows\] 天若ocr开源版6.1-增加openai兼容接口 链接:[https://pan.xunlei.com/s/VOhZip2vdw8LbSmV6DMe48WiA1?pwd=wjip#](https://pan.xunlei.com/s/VOhZip2vdw8LbSmV6DMe48WiA1?pwd=wjip# "https://pan.xunlei.com/s/VOhZip2vdw8LbSmV6DMe48WiA1?pwd=wjip#")  * 增加 **`OpenAI兼容`** 接口,只要`api`支持`openai`兼容格式,都可以使用:`设置-AI密钥`,`设置-AI翻译接口` * 工具栏图标增加自定义大小功能:`设置-常规2-其他` * 增加添加文本改变后自动翻译功能的时间设置,设置为`0`时可以关闭此功能,使用高级语法可控制哪些接口关闭和开启此功能:`设置-常规2`,高级语法请看官方文档 * 增加`webdav`备份功能(实验性),只会备份`Data`文件夹,离线接口的模型、字典、高级配置文件和`ai`接口的模式文件如果不在`Data`文件夹,都不会被`webdav`备份,需要手动备份 * 设置窗口增加**鼠标滚轮切换设置页**功能,方便滚动切换设置页,需要把鼠标放到设置页的标题栏,然后滚动鼠标滚轮 * 设置窗口**允许调整宽度**,方便点击切换设置页,宽度会记忆至程序退出,如果软件重启,不会恢复上次的宽度 * 修复使用"右键菜单-转换-汉语拼音"时如果弹窗报错,之后点击翻译按钮会一直弹窗报错,除非重启软件的 bug * 修复二维码识别在识别纯文本二维码时结果为空的 bug * 修复有时翻译会翻译两次的 bug,出现场景比如文本变动自动翻译还没到时间前,用户手动点击一次翻译,之后自动翻译的时间到了,又会重新翻译一次 * 修复粘贴含有`emoji`的文本时,导致所有中文字符变方块的 bug * 优化:切换字体不再触发重新翻译 * **调整`paddleocr`,`paddleocr2`,`rapidocr`三个离线接口的识别效果**,修复多行文本识别结果有时缺失某个或几个换行的问题。调整后可能会出现段落文本识别结果多出换行的情况,后续看反馈多不多 * 优化程序目录,将大部分`dll`移动到`lib`文件夹(测试),看起来更整洁。如果遇到错误,请将`lib`文件夹里的`dll`移动回`exe`同级目录,并至仓库联系作者反馈 `openai`兼容接口使用智谱的免费的`glm-4.6v-flash`模型测试的,理论上支持`openai`兼容格式的`api`都能使用,如果遇到不能使用的请反馈。
相关推荐
li三河1 天前
paddlepaddle-gpu3.0.0进行ocr训练SYC_MORE3 天前
无需 OCR,多模态大模型如何“读懂” PDF?——基于 GLM-4V-Flash 的智能文档解析原理剖析小娜老师3 天前
Linux(Centos7)下进行OCR识别-pytesseract文档伴侣3 天前
体验访答:我的私有知识库新选择AI人工智能+3 天前
大模型如何革新银行流水信息抽取TG:@yunlaoda360 云老大3 天前
华为云国际站代理商OCR的多语种识别能力可以应用于哪些行业?TG:@yunlaoda360 云老大3 天前
华为云国际站代理商OCR的多语种识别能力可以应用于哪些场景?TTGGGFF3 天前
实用代码工具:Python打造PDF选区OCR / 截图批量处理工具(支持手动/全自动模式)真·skysys4 天前
【技术报告解读】DeepSeek-OCR: Contexts Optical Compression