2M大小的PDF文档上传到LangChain-ChatGLM知识图谱中,大致需要的时间

对于将2M大小的PDF文档上传到LangChain-ChatGLM知识图谱中,大致需要的时间如下:

  • PDF到文本的提取转换:若PDF内容主要为文本,此步骤约需要1-2分钟。

  • 提取的文本经过预处理与分析:此步骤需要对文本进行分词、命名实体识别等处理,约需要2-5分钟。

  • 抽取文本中的结构化知识(实体、关系等)保存在图数据库中:对于2M文字,此步骤约需要5-10分钟。

  • 知识图与模型串联,使模型能利用新知识进行响应:这一步通常无需手动操作,模型在后台学习新知识,大约需要10-30分钟。

所以对一个普通2M PDF文档来说,整个上传并使LangChain-ChatGLM模型学习 吸收新知识的过程,大致需要10-30分钟。

需要注意的时:

  • 文本复杂程度影响预处理时间
  • 服务器性能会影响各个步骤的执行时间
  • 更大文档需要相对更长时间完成解析和学习
  • 模型学习新知识是异步进行的,只是大致时间

总体而言,对一个2M PDF来说,LangChain-ChatGLM可以在半小时内完成知识吸收,这与实际应用需求相匹配。更大文件相应需要更长时间。

相关推荐
南瓜胖胖20 分钟前
【seismic unix 合并两个su文件】
服务器·unix
Allen_LVyingbo34 分钟前
数智读书笔记系列035《未来医疗:医疗4.0引领第四次医疗产业变革》
人工智能·经验分享·笔记·健康医疗
zzc92139 分钟前
时频图数据集更正程序,去除坐标轴白边及调整对应的标签值
人工智能·深度学习·数据集·标签·时频图·更正·白边
isNotNullX41 分钟前
什么是数据分析?常见方法全解析
大数据·数据库·数据仓库·人工智能·数据分析
riveting1 小时前
明远智睿H618:开启多场景智慧生活新时代
人工智能·嵌入式硬件·智能硬件·lga封装·3506
夜阑卧听风吹雨,铁马冰河入梦来1 小时前
Spring AI 阿里巴巴学习
人工智能·学习·spring
weixin_399380691 小时前
k8s一键部署tongweb企业版7049m6(by why+lqw)
java·linux·运维·服务器·云原生·容器·kubernetes
阿巴~阿巴~1 小时前
Linux基本命令篇 —— uname命令
linux·运维·服务器
c7691 小时前
【文献笔记】Automatic Chain of Thought Prompting in Large Language Models
人工智能·笔记·语言模型·论文笔记
天空之城夢主1 小时前
KVM高级功能部署
linux·服务器