近期知识库开发过程中遇到的一些问题

我们正在使用Rust开发一个知识库系统,遇到了一些问题,在此记录备忘。

  • 错误:Unable to make method calls because underlying connection is closed

    场景:在docker中调用headless_chrome时出错

    原因:为减小镜像大小,我们使用官方ubuntu镜像,该镜像是最小化镜像,无其他依赖,需要将依赖库复制到镜像中,在复制so文件时,遗漏了/usr/lib/x86_64-linux-gnu/nss下的内容,导致网络连接问题。

  • libreoffice免安装启动

    我们对libreoffice做了适当的精简,实现了通过rust调用libreoffice完成word、excel、ppt等格式到pdf的转换。在此过程中,遇到了不少缺失so的问题。

    解决办法:现在本地安装libreoffice,然后将缺失的so拷贝到压缩包,同时也需要将安装路径下的文件全部拷贝。

  • 知识库上下文不连贯

    将知识库文本内容切分后存入向量数据库,但是查询时有时会出现直接截断的情况,导致上下文不连贯

    解决:使用链式存储,通过记录数据的前后指向来组成一个双向联表,查询时,向前或向后扩展适当的记录。

相关推荐
applepie_max8 小时前
GraphRAG本地部署 v2.7.0
python·rag·graphrag
fqbqrr17 小时前
2510rs,rust清单1
rust
熊猫钓鱼>_>17 小时前
Rust语言特性深度解析:所有权、生命周期与模式匹配之我见
算法·rust·软件开发·函数·模式匹配·异步编程·质量工具
fqbqrr17 小时前
2510rs,rust清单2
rust
Source.Liu17 小时前
【pulldown-cmark】 初学者指南
rust·markdown·pulldown-cmark
呼啦啦嘎嘎18 小时前
《100 Exercises To Learn Rust》练习笔记
rust
Amos_Web19 小时前
Rust实战课程--网络资源监控器(初版)
前端·后端·rust
花菜会噎住19 小时前
Chainlit+LlamaIndex 多模态 RAG 开发实战7:从系统架构到功能落地,搞定 PDF/PPT/ 图片全类型文件处理
pdf·大模型·rag·llamaindex
bestcxx1 天前
0.3、AI Agent 知识库、召回、Recall、Embedding等 相关的概念
embedding·知识库·dify·rag·ai agent·recall·召回
WujieLi1 天前
初识 Vite+:一文了解 Rust 驱动的新一代前端工具链
javascript·rust·vite