用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
玛卡巴卡ldf几秒前
【LeetCode 手撕算法】(矩阵)73-矩阵置零、54-螺旋矩阵(贪吃蛇)、48-旋转图像
java·数据结构·算法·leetcode·力扣
不吃香菜学java2 分钟前
苍穹外卖-新增套餐
java·spring boot·spring·tomcat·maven·mybatis
wangchunting3 分钟前
Spring Boot 概述
java·spring boot·后端
为美好的生活献上中指6 分钟前
*Java 沉淀重走长征路*之——《Linux 从入门到企业实战:一套六步法,带你打通运维与开发的任督二脉》
java·linux·运维·开发语言·阿里云·华为云·linux命令
Mr.wangh6 分钟前
redis面试题总结
java·redis·面试
wuqingshun31415910 分钟前
依赖注入的方式有几种,各是什么?
java·开发语言
冬夜戏雪19 分钟前
实习面经(十二)
java
JosieBook27 分钟前
【C#】C# 中的 enum、struct 和 class 对比总结
开发语言·算法·c#
编码忘我28 分钟前
JVM 运行时数据区详解
java·后端·程序员
阿唯不困29 分钟前
AI智能应用开发(Java)从起点到终点-面向对象
java·后端