从 Kindle 文件中提取内容
2023 年 12 月 6 日
GroupDocs.Parser V23.11 增加了对 Kindle 文档格式的支持,支持从 Kindle 电子书和文档中提取文本和元数据。
GroupDocs.Parser 是一款全面的文档解析解决方案,使您能够从多种文档格式中提取文本、元数据和图像,包括 PDF、DOC、DOCX、PPT、PPTX、XLS、XLSX、ODT、ODS、RTF 和EPUB。
GroupDocs.Parser V23.11 增加了对 Kindle 文档格式的支持,使开发人员能够从 Kindle 电子书和文件中提取文本、元数据和图像。开发人员现在可以有效地处理和分析 Kindle 文档,为各种应用程序提取有价值的信息,例如文档搜索和索引、数据集成和工作流程自动化。
适用于 .NET V23.11 的 GroupDocs.Parser
发布日期:2023 年 11 月 24 日
V23.11更新
特征
- 添加了对 Kindle 文档格式的支持。
- 改进了模板解析功能。
修复
- 无法在一种环境中解析 .xlsx 和 .docx 文件。
GroupDocs.Parser for .NET 是一个文本、元数据和图像提取器 API,适用于使用 C#、ASP.NET 和其他 .NET 技术开发的业务应用程序。它支持从支持格式的文件中提取原始、格式化和结构化文本以及元数据。通过 GroupDocs.Parser for .NET,您的应用程序还可以对流行格式的受密码保护的文档进行解析,例如 Microsoft Word 文档、Excel 电子表格、PowerPoint 演示文稿、OneNote、PDF 文件和 ZIP 存档。
点击查看更多
支持的文件格式
文本提取
- 文本:DOC、DOCX、DOT、DOTM、DOTX、DOCM、RTF、ODT、OTT、TXT、MD、WordprocessingML (XML)
- 电子表格:XLS、XLSX、CSV、XLSM、XLSB、ODS、SpreadsheetML (XML)、XLT、XLTX、XLTM、OTS、XLA、XLAM、TSV
- 演示文稿:PPT、PPTX、PPTM、PPS、PPSX、PPSM、POT、POTX、POTM、ODP、OTP
- OneNote:一
- 电子邮件:MSG、EML、EMLX、PST、OST、MS EXCHANGE SERVER、POP、IMAP
- 电子出版:EPUB、FB2
- 便携式文档:PDF、PDF 包、加密 PDF
- 基于 DOM:XML、HTML、XHTML...