用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
Scout-leaf4 分钟前
WPF新手村教程(一) - 走不出新手村别找我
c#·wpf
SadSunset11 分钟前
(9)基于xml的自动装配
java·笔记·spring
璞瑜无文12 分钟前
Unity 游戏开发之布局(二)
unity·c#·游戏引擎
董世昌4116 分钟前
JavaScript 变量声明终极指南:var/let/const 深度解析(2025 版)
java·服务器·前端
sheji341618 分钟前
【开题答辩全过程】以 个人网站的设计与实现为例,包含答辩的问题和答案
java·eclipse
LFly_ice20 分钟前
Nest-管道
android·java·数据库
剽悍一小兔20 分钟前
为什么使用postman发送请求时不会有跨域问题?
java
Cherry的跨界思维22 分钟前
19、自动化处理双核心:Java规则引擎与Python Selenium实战全解析
java·开发语言·python·自动化·办公自动化·python办公自动化·python办公
hunter1990101 小时前
Spring线程池ThreadPoolTaskExecutor配置与实践
java·后端·spring
用户8356290780511 小时前
C# 实现 XML 转 Excel:从解析到生成 XLSX 的详细步骤
后端·c#