docling:PDF解析

目录

环境部署

下载

bash 复制代码
git clone https://gitclone.com/github.com/DS4SD/docling.git
conda create -n docling python=3.11
conda activate docling
pip install docling

安装模型

bash 复制代码
git clone https://www.modelscope.cn/AI-ModelScope/docling-models.git
git clone https://gitclone.com/github.com/JaidedAI/EasyOCR.gi
t

部署问题

缺少.pth文件,是去modelscope官网下载

用法

转换单个文档

bash 复制代码
from docling.document_converter import DocumentConverter


source = "demo1.pdf"  # PDF path or URL
converter = DocumentConverter()
result = converter.convert(source)
print(result.document.export_to_markdown())  # output: "### Docling Technical Report[...]"

解析效果

速度0.96秒/页

但是公式解析效果差

相关推荐
大卡拉米1 天前
前端组件库 PDF、word、Excel预览
前端·pdf·word
dagouaofei2 天前
全面整理6款文档生成PPT工具,PDF转PPT不再难
python·pdf·powerpoint
yesyesyoucan2 天前
PDF全能处理站:压缩、拆分、合并一站式解决方案与核心技术解析
pdf
sunon_2 天前
解决linux系统PDF中文乱码问题
linux·运维·pdf
小灰灰搞电子2 天前
Qt PDF模块详解
数据库·qt·pdf
TextIn智能文档云平台2 天前
如何将公司内部知识库(Word/PDF)接入大模型?
pdf·word
HSJ01702 天前
PDF专业转换工具 - 专业版V0.1,PDF转图片、拆分、合并,高效稳定可靠,永久免费使用
pdf
dagouaofei2 天前
文档生成PPT到底快不快?PDF转PPT工具实测分析
python·pdf·powerpoint
轻竹办公PPT3 天前
上传PDF直接生成PPT,适合工作汇报和总结场景
python·pdf·powerpoint
非凡ghost3 天前
FlexiPDF(专业PDF编辑软件)
windows·学习·pdf·软件需求