【PDF操作】C#使用iTextSharp获取PDF文件的书签信息

文章目录


一、新建项目,引用iTextSharp.dll

新建Winform项目,并且下载iTextSharp.dll,并在项目中引用。

二、获取PDF的书签

csharp 复制代码
using iTextSharp.text.pdf;
using System;
using System.Collections.Generic;

// 递归函数,用于获取指定书签下的所有子书签并保持结构
List<Dictionary<string, object>> GetAllSubBookmarks(List<Dictionary<string, object>> bookmarks, string parentTitle)
{
    List<Dictionary<string, object>> result = new List<Dictionary<string, object>>();

    foreach (var bookmark in bookmarks)
    {
        string title = (string)bookmark["Title"];

        if (title == parentTitle)
        {
            if (bookmark.ContainsKey("Kids"))
            {
                List<Dictionary<string, object>> kids = (List<Dictionary<string, object>>)bookmark["Kids"];
                foreach (var subBookmark in kids)
                {
                    Dictionary<string, object> subBookmarkWithChildren = new Dictionary<string, object>();
                    subBookmarkWithChildren["Title"] = subBookmark["Title"];
                    subBookmarkWithChildren["Page"] = subBookmark["Page"];
                    subBookmarkWithChildren["Kids"] = GetAllSubBookmarks(kids, (string)subBookmark["Title"]);

                    result.Add(subBookmarkWithChildren);
                }
            }
        }
    }

    return result;
}

// 加载PDF文件
PdfReader reader = new PdfReader("your_pdf_file_path.pdf");

// 获取PDF的目录信息
List<Dictionary<string, object>> bookmarks = SimpleBookmark.GetBookmark(reader);

// 获取第一个书签下的所有子书签并保持结构
string parentTitle = (string)bookmarks[0]["Title"];
List<Dictionary<string, object>> allSubBookmarks = GetAllSubBookmarks(bookmarks, parentTitle);

// 输出所有子书签
foreach (var subBookmark in allSubBookmarks)
{
    Console.WriteLine("Sub-Title: " + subBookmark["Title"] + ", Page: " + subBookmark["Page"]);
    if (subBookmark.ContainsKey("Kids"))
    {
        foreach (var childBookmark in (List<Dictionary<string, object>>)subBookmark["Kids"])
        {
            Console.WriteLine("  Child Title: " + childBookmark["Title"] + ", Page: " + childBookmark["Page"]);
        }
    }
}

// 关闭PDF阅读器
reader.Close();
  1. 定义递归函数 GetAllSubBookmarks :

    • 这个函数通过递归方式获取指定书签下的所有子书签并保持结构。它接受两个参数:书签列表和父书签的标题。
    • 函数首先创建一个空的结果列表 result 用于存储子书签信息。
    • 然后遍历书签列表中的每个书签,如果书签的标题与指定的父标题匹配,则继续处理该书签。
    • 如果该书签包含子书签(即有 "Kids" 键),则递归调用 GetAllSubBookmarks 函数来获取子书签,并将子书签信息添加到当前书签的子书签列表中。
    • 最后,将当前书签及其子书签信息添加到结果列表中,并最终返回结果列表。
  2. 加载PDF文件和获取目录信息:

    • 使用 PdfReader 类加载指定的PDF文件。
    • 使用 SimpleBookmark.GetBookmark(reader) 方法获取PDF文件的目录信息,并将其存储在 bookmarks 列表中。
  3. 获取第一个书签下的所有子书签:

    • 从目录信息中获取第一个书签的标题,然后调用 GetAllSubBookmarks 函数来获取该书签下的所有子书签,并将结果存储在 allSubBookmarks 列表中。
  4. 输出所有子书签:

    • 遍历 allSubBookmarks 列表,输出每个子书签的标题和页码信息。
    • 如果子书签包含子书签(即有 "Kids" 键),则继续遍历并输出每个子书签的标题和页码信息。
  5. 关闭PDF阅读器:

    • 使用 reader.Close() 方法关闭PDF文件阅读器。
相关推荐
好望角雾眠8 分钟前
第一阶段C#基础-10:集合(Arraylist,list,Dictionary等)
笔记·学习·c#
有梦想的攻城狮6 小时前
Java 11中的Collections类详解
java·windows·python·java11·collections
忒可君6 小时前
C# winform FTP功能
开发语言·windows·c#
十五年专注C++开发7 小时前
CMake进阶: CMake Modules---简化CMake配置的利器
linux·c++·windows·cmake·自动化构建
degree5207 小时前
全平台轻量浏览器推荐|支持Win/macOS/Linux,极速加载+隐私保护+扩展插件,告别广告与数据追踪!
windows·macos·电脑
时光追逐者7 小时前
C#/.NET/.NET Core技术前沿周刊 | 第 50 期(2025年8.11-8.17)
c#·.net·.netcore·.net core
一个会的不多的人8 小时前
C# NX二次开发:操作按钮控件Button和标签控件Label详解
开发语言·c#
咕白m6258 小时前
C# 实现 PDF 转图片 - 分辨率设置、图片格式选择
后端·c#
与火星的孩子对话10 小时前
Unity高级开发:反射原理深入解析与实践指南 C#
java·unity·c#·游戏引擎·lucene·反射
Dm_dotnet11 小时前
回顾一下WPF原生实现命令
c#