解决方法
博主使用的是pdfminer解析PDF文档,这个解决方法是通用的,只需要使PDFParser传入的文件为二进制文件即可,示例程序:
            
            
              py
              
              
            
          
          from pdfminer.pdfparser import PDFParser
pdf_parser = PDFParser(open("pdf文件.pdf", "rb"))
        问题解析
网上down下来的PDF在解析的时候会出现这个问题,导致原来解析程序的逻辑无法读取新的pdf,因此统一修改解析的程序为
            
            
              py
              
              
            
          
          pdf_parser = PDFParser(open("pdf文件.pdf", "rb"))
        即可解决一些稀奇古怪的PDF问题