用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
吴声子夜歌5 分钟前
Java——字符编码
java·字符编码·char
冷小鱼6 分钟前
多线程编程深度解析:Java与Python框架实战指南
java·开发语言·python·多线程
java1234_小锋25 分钟前
Spring AI 2.0 开发Java Agent智能体 - 结构化输出
java·人工智能·spring
asdfg125896326 分钟前
Java 大型项目设计的“内功心法”---面向对象和接口编程
java·开发语言
时光追逐者26 分钟前
2026 年 .NET 客户端常用 MVVM 框架推荐
c#·.net·mvvm·.net core
ch.ju27 分钟前
Java programming Chapter Three——Array
java·开发语言
努力努力再努力wz40 分钟前
【Qt入门系列】第一个 Qt Widgets 程序:项目创建、UI 文件、Hello World、对象树与 qDebug 日志
java·c语言·开发语言·数据结构·c++·qt·ui
东南门吹雪1 小时前
Spring事务传播机制深度解析
java·数据库·spring
XS0301061 小时前
Java基础 List集合
java·windows·list