技术栈
qwen 2.5
安替-AnTi
7 小时前
pdf
·
ocr
·
多模态
·
qwen 2.5
·
图片转文本
Google Colab测试部署Qwen大模型,实现PDF转MD场景OCR 识别(支持单机环境)
在使用大模型处理书籍 PDF 时,有时你会遇到扫描版 PDF,也就是说每一页其实是图像形式。这时,大模型需要先从图片中提取文本,而这就需要借助 OCR(光学字符识别)技术。