用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
Dolphin_Home5 分钟前
深度解析:SpringBoot 静态类调用 Bean 的底层逻辑与最优实践
java·spring boot·后端
故渊ZY10 分钟前
Spring JavaConfig:注解驱动的配置革命
java·spring
秋雨雁南飞11 分钟前
c# 多项目编译发布
c#
一水鉴天13 分钟前
整体设计 定稿 之20 拼语言表述体系之3 dashboard.html完整代码
java·前端·javascript
静若繁花_jingjing14 分钟前
Spring Bean基础
java·后端·spring
拓端研究室14 分钟前
专题:2025年汽车行业研究报告-重塑之局:新能源、智能网联与全球化|附340+份报告PDF、数据、可视化模板汇总下载
pdf
CoderYanger17 分钟前
A.每日一题——2141.同时运行N台电脑的最长时间
java·算法·leetcode·职场和发展·1024程序员节
旺仔Sec18 分钟前
2025年广东省职业院校技能大赛应用软件系统开发赛项(高职组)赛题(一)
java·应用软件系统开发
雨中飘荡的记忆23 分钟前
Spring AI + Redis 向量库实战
java·redis·spring
CC.GG26 分钟前
【C++】面向对象三大特性之一——继承
java·数据库·c++