技术栈
从文档中取数据
咖啡因依赖症患者
22 天前
apahce tika
·
从文档中取数据
通过apache tika从文档(pdf、doc、docx、txt)中 提取特征数据
本文介绍如何通过apache tika从文档(pdf、doc、docx、txt)中 提取特征数据,比如文档中有身份证、姓名等信息。【全部是经本人实际测试过的功能】