技术栈
tika文件解析
程序员三明治
21 小时前
java
·
人工智能
·
大模型
·
llm
·
后端开发
·
rag
·
tika文件解析
【AI】Tika:一次文档解析引擎的工程实践
去年我接到一个任务:为公司内部知识管理平台搭建文档入库能力。需求很直白——用户上传各种格式的文件(PDF、Word、PPT、Excel),系统自动提取文本,灌入检索引擎,支撑后续的语义搜索和智能问答。
我是有底线的