从 Kindle 文件中提取内容:GroupDocs.Parser V23.11

从 Kindle 文件中提取内容

2023 年 12 月 6 日
GroupDocs.Parser V23.11 增加了对 Kindle 文档格式的支持,支持从 Kindle 电子书和文档中提取文本和元数据。

GroupDocs.Parser 是一款全面的文档解析解决方案,使您能够从多种文档格式中提取文本、元数据和图像,包括 PDF、DOC、DOCX、PPT、PPTX、XLS、XLSX、ODT、ODS、RTF 和EPUB。

GroupDocs.Parser V23.11 增加了对 Kindle 文档格式的支持,使开发人员能够从 Kindle 电子书和文件中提取文本、元数据和图像。开发人员现在可以有效地处理和分析 Kindle 文档,为各种应用程序提取有价值的信息,例如文档搜索和索引、数据集成和工作流程自动化。

适用于 .NET V23.11 的 GroupDocs.Parser

发布日期:2023 年 11 月 24 日

V23.11更新

特征
  • 添加了对 Kindle 文档格式的支持。
  • 改进了模板解析功能。
修复
  • 无法在一种环境中解析 .xlsx 和 .docx 文件。

GroupDocs.Parser for .NET 是一个文本、元数据和图像提取器 API,适用于使用 C#、ASP.NET 和其他 .NET 技术开发的业务应用程序。它支持从支持格式的文件中提取原始、格式化和结构化文本以及元数据。通过 GroupDocs.Parser for .NET,您的应用程序还可以对流行格式的受密码保护的文档进行解析,例如 Microsoft Word 文档、Excel 电子表格、PowerPoint 演示文稿、OneNote、PDF 文件和 ZIP 存档。
点击查看更多


支持的文件格式

文本提取

  • 文本:DOC、DOCX、DOT、DOTM、DOTX、DOCM、RTF、ODT、OTT、TXT、MD、WordprocessingML (XML)
  • 电子表格:XLS、XLSX、CSV、XLSM、XLSB、ODS、SpreadsheetML (XML)、XLT、XLTX、XLTM、OTS、XLA、XLAM、TSV
  • 演示文稿:PPT、PPTX、PPTM、PPS、PPSX、PPSM、POT、POTX、POTM、ODP、OTP
  • OneNote:一
  • 电子邮件:MSG、EML、EMLX、PST、OST、MS EXCHANGE SERVER、POP、IMAP
  • 电子出版:EPUB、FB2
  • 便携式文档:PDF、PDF 包、加密 PDF
  • 基于 DOM:XML、HTML、XHTML...