解决RAGFlow(v0.19.0)有部分PDF无法解析成功的问题。

ragflow版本为:v0.19.0

1.解析的时候报错:Internal server error while chunking: Coordinate lower is less than upper。

看报错怀疑是分片的问题,于是把文档的切片方法中的"建议文本块大小"数值(默认512)调小,比如300,发现有些原来不能解析的PDF文档能成功解析了。

2.但是还是有些PDF解析的时候报错如下图:

看报错怀疑是内存不足,实际查看了下CPU的使用情况,发现解析文档的时候CPU已经使用到了99%。但是我使用的启动容器命令是:docker compose -p ragflow -f docker-compose-gpu.yml up -d 。按理说应该使用GPU的,无解。于是想着怎么精简内存,考虑到我们的嵌入模型是自己部署的,于是决定不在使用v0.19.0版本, 遂将docker/.env 文件内的 RAGFLOW_IMAGE 变量改成使用v0.19.0-slim,这样可以减少使用的内存。

重启,发现能成功解析文档。

如果您有其他更好的解决方法,欢迎一起留言讨论。

相关推荐
优化控制仿真模型17 小时前
2026年初中英语大纲词汇表1600词
经验分享·pdf
优化控制仿真模型17 小时前
方正小标宋简体、仿宋GB2312和楷体_GB2312办公字体安装包下载安装教程
经验分享·pdf
王莎莎-MinerU18 小时前
MinerU 生态全景:Skills、RAG、MCP、Cursor Rules
人工智能·深度学习·计算机视觉·chatgpt·pdf·软件工程
包子源20 小时前
React-PDF 与 Web 预览「像素级」对齐实践
前端·react.js·pdf
ComPDFKit21 小时前
PDF to OFD——国产版式文件转换的技术与应用
pdf
2501_907136821 天前
PDF Font Fixer 修复PDF文档不能复制粘贴问题
pdf·软件需求
2501_930707781 天前
使用C#代码将 PDF 转换为线性化格式
pdf
包子源1 天前
React-PDF 详解:API 要点与在线简历项目中的落地
前端·react.js·pdf
ONLYOFFICE1 天前
11款Linux PDF编辑工具横评|开源、免费为主
linux·pdf·onlyoffice
E_ICEBLUE1 天前
Python 控制 PDF 页面大小、页边距、页面方向与缩放
python·pdf