用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
手握风云-几秒前
JavaEE 进阶第十五期:Spring 日志的笔墨艺术
java·spring·java-ee
仟濹4 分钟前
【Java加强】2 泛型 | 打卡day1
java·开发语言
Hx_Ma165 分钟前
SpringBoot注册格式化器
java·spring boot·后端
人工智能AI技术6 分钟前
智能体元年第一课:使用Microsoft Foundry + AI Toolkit 10分钟构建你的第一个多模态Agent
人工智能·c#
V胡桃夹子9 分钟前
VS Code / Lingma AI IDE Java 开发攻略手册
java·ide·人工智能
独自破碎E10 分钟前
【回溯】二叉树的所有路径
android·java
风景的人生12 分钟前
application/x-www-form-urlencoded
java·mvc
sheji341613 分钟前
【开题答辩全过程】以 基于Java的流浪猫救济中心系统的设计与实现为例,包含答辩的问题和答案
java·开发语言
毕设源码-郭学长14 分钟前
【开题答辩全过程】以 高校选修课管理系统的设计与实现为例,包含答辩的问题和答案
java
爱吃面条的猿17 分钟前
FontMetrics 字体属性类 java
java