用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
alden_ygq8 分钟前
当java进程内存使用超过jvm设置大小会发生什么?
java·开发语言·jvm
triticale21 分钟前
【Java】网络编程(Socket)
java·网络·socket
淘源码d24 分钟前
什么是ERP?ERP有哪些功能?小微企业ERP系统源码,SpringBoot+Vue+ElementUI+UniAPP
java·源码·erp·erp源码·企业资源计划·企业erp·工厂erp
源码方舟25 分钟前
【基于ALS模型的教育视频推荐系统(Java实现)】
java·python·算法·音视频
Mcworld8571 小时前
整数分解JAVA
java·开发语言
小南家的青蛙1 小时前
LeetCode面试题 01.09 字符串轮转
java·leetcode
神仙别闹1 小时前
基于C#+SQL Server开发(WinForm)租房管理系统
数据库·oracle·c#
秋野酱2 小时前
基于javaweb的SpringBoot爱游旅行平台设计和实现(源码+文档+部署讲解)
java·spring boot·后端
饕餮争锋2 小时前
org.slf4j.MDC介绍-笔记
java·开发语言·笔记
shane-u2 小时前
Maven私服搭建与登录全攻略
java·maven