Windows\] 天若ocr开源版6.1-增加openai兼容接口 链接:[https://pan.xunlei.com/s/VOhZip2vdw8LbSmV6DMe48WiA1?pwd=wjip#](https://pan.xunlei.com/s/VOhZip2vdw8LbSmV6DMe48WiA1?pwd=wjip# "https://pan.xunlei.com/s/VOhZip2vdw8LbSmV6DMe48WiA1?pwd=wjip#")  * 增加 **`OpenAI兼容`** 接口,只要`api`支持`openai`兼容格式,都可以使用:`设置-AI密钥`,`设置-AI翻译接口` * 工具栏图标增加自定义大小功能:`设置-常规2-其他` * 增加添加文本改变后自动翻译功能的时间设置,设置为`0`时可以关闭此功能,使用高级语法可控制哪些接口关闭和开启此功能:`设置-常规2`,高级语法请看官方文档 * 增加`webdav`备份功能(实验性),只会备份`Data`文件夹,离线接口的模型、字典、高级配置文件和`ai`接口的模式文件如果不在`Data`文件夹,都不会被`webdav`备份,需要手动备份 * 设置窗口增加**鼠标滚轮切换设置页**功能,方便滚动切换设置页,需要把鼠标放到设置页的标题栏,然后滚动鼠标滚轮 * 设置窗口**允许调整宽度**,方便点击切换设置页,宽度会记忆至程序退出,如果软件重启,不会恢复上次的宽度 * 修复使用"右键菜单-转换-汉语拼音"时如果弹窗报错,之后点击翻译按钮会一直弹窗报错,除非重启软件的 bug * 修复二维码识别在识别纯文本二维码时结果为空的 bug * 修复有时翻译会翻译两次的 bug,出现场景比如文本变动自动翻译还没到时间前,用户手动点击一次翻译,之后自动翻译的时间到了,又会重新翻译一次 * 修复粘贴含有`emoji`的文本时,导致所有中文字符变方块的 bug * 优化:切换字体不再触发重新翻译 * **调整`paddleocr`,`paddleocr2`,`rapidocr`三个离线接口的识别效果**,修复多行文本识别结果有时缺失某个或几个换行的问题。调整后可能会出现段落文本识别结果多出换行的情况,后续看反馈多不多 * 优化程序目录,将大部分`dll`移动到`lib`文件夹(测试),看起来更整洁。如果遇到错误,请将`lib`文件夹里的`dll`移动回`exe`同级目录,并至仓库联系作者反馈 `openai`兼容接口使用智谱的免费的`glm-4.6v-flash`模型测试的,理论上支持`openai`兼容格式的`api`都能使用,如果遇到不能使用的请反馈。
相关推荐
AI人工智能+4 天前
CNN+CRNN+NER:如何实现食品经营许可证秒级结构化信息提取?摆烂小白敲代码5 天前
腾讯云智能结构化OCR在物流行业的应用开开心心就好8 天前
免费音频转文字工具,绿色版离线多模型可用开开心心_Every9 天前
全屏程序切换工具,激活选中窗口快速切换2401_8362358610 天前
名片识别产品:技术要点与应用场景深度解析njsgcs11 天前
glm-ocr ollama使用 python开开心心就好11 天前
轻松鼠标连, 自定义区域模仿人手点击littleshimmer11 天前
基于 C++ + Qt6 实现一款本地离线 OCR 工具(SnapOCR)AI周红伟13 天前
周红伟:企业大模型微调和部署, DeepSeek-OCR v2技术原理和架构,部署案例实操。RAG+Agent智能体构建kongba00715 天前
如何在本地创建一个OCR工具,帮你识别文档,发票,合同等细碎的内容,并将结果给大模型整理格式输出。 经验工作流。给大模型生成代码就能直接跑。