技术栈

图片转文本

安替-AnTi
21 天前
pdf·ocr·多模态·qwen 2.5·图片转文本
Google Colab测试部署Qwen大模型,实现PDF转MD场景OCR 识别(支持单机环境)在使用大模型处理书籍 PDF 时,有时你会遇到扫描版 PDF,也就是说每一页其实是图像形式。这时,大模型需要先从图片中提取文本,而这就需要借助 OCR(光学字符识别)技术。