MarkItDown vs Docling:文档处理工具哪家强?MarkItDown 是微软开发的一个轻量级 Python 工具,主要用于将各种文件转换为 Markdown,特别适合与大型语言模型(LLM)和文本分析管道一起使用。它支持广泛的文件格式,包括 PDF、PowerPoint、Word、Excel、图像、音频、HTML、文本格式、ZIP 文件、YouTube 链接和 EPub 等。它的 Markdown 输出优化了 LLM 输入,部分功能可能需要使用 Azure Document Intelligence,这可能涉及云服务。