【maker-pdf 文档文字识别(包含ocr),安装使用完整教程】

测试效果还比较好,比markitdown要好

安装环境

bash 复制代码
conda create -n maker-pdf python=3.12
conda activate marker-pdf
pip install modelscope
pip install marker-pdf -U

下载模型

python 复制代码
from modelscope import snapshot_download

model_root = "models"
snapshot_download("Lixiang/marker-pdf", local_dir="models")

开始运行

python 复制代码
from marker.converters.pdf import PdfConverter
from marker.models import create_model_dict
from marker.output import text_from_rendered
from surya.settings import settings

## 权重地址,模型很大,没GPU的话会很慢
model_root = "models"
settings.MODEL_CACHE_DIR = model_root
for chectpoint in [
    "LAYOUT_MODEL_CHECKPOINT",
    "DETECTOR_MODEL_CHECKPOINT",
    "OCR_ERROR_MODEL_CHECKPOINT",
    "TABLE_REC_MODEL_CHECKPOINT",
    "RECOGNITION_MODEL_CHECKPOINT",
]:
    value = getattr(settings, chectpoint)
    if "s3://" in value:
	    value = value.replace("s3://", "/")
	    setattr(settings, chectpoint, model_root + value)

converter = PdfConverter(
    artifact_dict=create_model_dict(),
)
rendered = converter("test.pdf")
# text = rendered.markdown
text, _, images = text_from_rendered(rendered)
print(text)
相关推荐
Mr数据杨2 分钟前
【Dv3Admin】Django一键配置权限规则
python·django·sqlite
-杨豫4 分钟前
ZLibrary反爬破解实战:从验证码到加密全突破
python
2301_8184190120 分钟前
Python内存管理机制:垃圾回收与引用计数
jvm·数据库·python
qq_4176950524 分钟前
构建一个桌面版的天气预报应用
jvm·数据库·python
cm65432025 分钟前
Python在金融科技(FinTech)中的应用
jvm·数据库·python
小陈的进阶之路28 分钟前
Selenium 常用操作 API
python·自动化·pytest
2301_8166512230 分钟前
如何从Python初学者进阶为专家?
jvm·数据库·python
2501_9181269141 分钟前
学习所有python写服务器的语句
服务器·人工智能·python·学习·个人开发
m0_569881471 小时前
使用Python自动收发邮件
jvm·数据库·python
极光代码工作室1 小时前
基于机器学习的房价预测系统设计与实现
人工智能·python·深度学习·机器学习