解决方法
博主使用的是pdfminer解析PDF文档,这个解决方法是通用的,只需要使PDFParser
传入的文件为二进制文件即可,示例程序:
py
from pdfminer.pdfparser import PDFParser
pdf_parser = PDFParser(open("pdf文件.pdf", "rb"))
问题解析
网上down下来的PDF在解析的时候会出现这个问题,导致原来解析程序的逻辑无法读取新的pdf,因此统一修改解析的程序为
py
pdf_parser = PDFParser(open("pdf文件.pdf", "rb"))
即可解决一些稀奇古怪的PDF问题