用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
多多*29 分钟前
图解Redis的分布式锁的历程 从单机到集群
java·开发语言·javascript·vue.js·spring·tomcat·maven
想用offer打牌35 分钟前
2025年总结:一个树苗倔强生长
java·后端·开源·go
a程序小傲1 小时前
国家电网面试被问:FactoryBean与BeanFactory的区别和动态代理生成
java·linux·服务器·spring boot·spring·面试·职场和发展
电商API&Tina1 小时前
Python请求淘宝商品评论API接口全指南||taobao评论API
java·开发语言·数据库·python·json·php
若鱼19191 小时前
SpringBoot4.0新特性-Resilience之失败重试
java·spring
摩西蒙1 小时前
业务监控和常用产品
java·大数据·人工智能
哪里不会点哪里.1 小时前
Spring 核心原理解析:它到底解决了什么问题?
java·后端·spring
qq_254674411 小时前
Cisco Nexus 9504交换机上
java·linux·服务器
咕噜企业分发小米1 小时前
腾讯云在多云管理工具上如何实现合规性要求?
java·云计算·腾讯云
invicinble2 小时前
关于对后端开发工程师,在项目层面的基本需求与进阶方向
java