解决RAGFlow(v0.19.0)有部分PDF无法解析成功的问题。

ragflow版本为:v0.19.0

1.解析的时候报错:Internal server error while chunking: Coordinate lower is less than upper。

看报错怀疑是分片的问题,于是把文档的切片方法中的"建议文本块大小"数值(默认512)调小,比如300,发现有些原来不能解析的PDF文档能成功解析了。

2.但是还是有些PDF解析的时候报错如下图:

看报错怀疑是内存不足,实际查看了下CPU的使用情况,发现解析文档的时候CPU已经使用到了99%。但是我使用的启动容器命令是:docker compose -p ragflow -f docker-compose-gpu.yml up -d 。按理说应该使用GPU的,无解。于是想着怎么精简内存,考虑到我们的嵌入模型是自己部署的,于是决定不在使用v0.19.0版本, 遂将docker/.env 文件内的 RAGFLOW_IMAGE 变量改成使用v0.19.0-slim,这样可以减少使用的内存。

重启,发现能成功解析文档。

如果您有其他更好的解决方法,欢迎一起留言讨论。

相关推荐
空谷有来人2 小时前
推荐一款PDF压缩的工具
pdf·pdf压缩
开开心心_Every2 小时前
免费且好用的PDF水印添加工具
android·javascript·windows·智能手机·pdf·c#·娱乐
aloha_7892 小时前
论文中pdf图片文件太大怎么办
图像处理·pdf·论文笔记
开开心心就好6 小时前
免费批量文件重命名软件
vue.js·人工智能·深度学习·typescript·pdf·excel·less
理工男大辉郎14 小时前
PDFGear——完全免费且功能强大的PDF处理软件
pdf·软件工程
課代表14 小时前
Adobe LiveCycle ES、LiveCycle DS 与 BlazeDS 关系解析与比较
数据库·adobe·pdf·express·livecycle·lcds·soa平台
IDRSolutions_CN15 小时前
PDF 转 HTML5 —— HTML5 填充图形不支持 Even-Odd 奇偶规则?(第一部分)
java·经验分享·pdf·软件工程·团队开发
SEO-狼术20 小时前
Enable users to export spreadsheets to PDF
linux·ubuntu·pdf
漫游者Nova21 小时前
微软markitdown PDF/WORD/HTML文档转Markdown格式软件整合包下载
pdf·html·word·markdown·ppt
普通老人2 天前
【前端】Vue中实现pdf逐页转图片,图片再逐张提取文字
前端·vue.js·pdf