用C#写一个读取pdf文档内容的库

安装这两个库,第二个库一定要安装否则有些pdf文件读取会出现异常

读取

csharp 复制代码
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf.Canvas.Parser.Listener;

namespace TestReadPdf
{
    public static class PdfHelper
    {
        public static IEnumerable<string> ExtractText(string filename)
        {
            using (var r = new PdfReader(filename))
            using (var doc = new PdfDocument(r))
            {
                for (int i = 1; i < doc.GetNumberOfPages(); i++)
                {
                    ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
                    string text = PdfTextExtractor.GetTextFromPage(doc.GetPage(i), strategy);
                    yield return text;
                }
            }
        }
    }
}
相关推荐
懈尘几秒前
基于Spring Boot与LangChain4j的AI驱动新闻系统设计与工程实现
java·大数据·人工智能·spring boot·后端·langchain
不会c+1 分钟前
Spring详解(二)IOC控制反转
java·开发语言
小锋学长生活大爆炸6 分钟前
【工具】免费的文本读写API
java·数据库·mysql
csgo打的菜又爱玩14 分钟前
数仓整体架构和建模架构
java·大数据·开发语言·架构
翱翔的苍鹰16 分钟前
多Agent智能体系统设计思路
java·python·深度学习·神经网络·机器学习·tensorflow
小花17 分钟前
java后端框架之spring
java·开发语言·spring
DS随心转小程序19 分钟前
ai转pdf
人工智能·pdf·aigc·deepseek·ds随心转
小王不爱笑13220 分钟前
Spring Boot 配置文件核心用法与加载优先级
java·spring boot·后端
开开心心_Every20 分钟前
手机PDF处理工具:支持格式转换与批注
游戏·微信·智能手机·pdf·逻辑回归·excel·语音识别
小北方城市网25 分钟前
Spring Cloud Gateway 动态路由进阶:基于 Nacos 配置中心的热更新与版本管理
java·前端·javascript·网络·spring boot·后端·spring