用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
躲在没风的地方几秒前
异常执行顺序
java·运维·服务器·spring boot
人工智能AI技术2 分钟前
315 AI乱象下的C#解法:构建可信、可审计的AI应用实战
人工智能·c#
没有bug.的程序员4 分钟前
黑客僵尸网络的降维打击:Spring Cloud Gateway 自定义限流剿杀 Sentinel 内存黑洞
java·网络·spring·gateway·sentinel
予枫的编程笔记5 分钟前
【面试专栏|Java并发编程】ConcurrentHashMap并发原理详解:JDK7 vs JDK8 核心对比
java·并发编程·hashmap·java面试·集合框架·jdk8·jdk7
程序员在线炒粉8元1份顺丰包邮送可乐8 分钟前
【Java 实现】用友 BIP V5 版本与飞书集成单点登录(飞书免密登录到用友 ERP)
java·开发语言·飞书·用友 bip
qq_4112624211 分钟前
AP模式中修改下wifi名称就无法连接了,分析一下
java·前端·spring
东离与糖宝12 分钟前
Spring AI MCP Server正式落地,Java一键部署AI服务保姆级教程
java·人工智能
微露清风13 分钟前
系统性学习Linux-第八讲-进程间通信
java·linux·学习
Knight_AL14 分钟前
Java 中 Date 与 LocalDate 的区别
java·开发语言·数据库
bug攻城狮17 分钟前
SpringBoot 脚手架搭建指南:从零构建企业级开发框架
java·spring boot·后端·架构·系统架构·设计规范