近期知识库开发过程中遇到的一些问题

我们正在使用Rust开发一个知识库系统,遇到了一些问题,在此记录备忘。

  • 错误:Unable to make method calls because underlying connection is closed

    场景:在docker中调用headless_chrome时出错

    原因:为减小镜像大小,我们使用官方ubuntu镜像,该镜像是最小化镜像,无其他依赖,需要将依赖库复制到镜像中,在复制so文件时,遗漏了/usr/lib/x86_64-linux-gnu/nss下的内容,导致网络连接问题。

  • libreoffice免安装启动

    我们对libreoffice做了适当的精简,实现了通过rust调用libreoffice完成word、excel、ppt等格式到pdf的转换。在此过程中,遇到了不少缺失so的问题。

    解决办法:现在本地安装libreoffice,然后将缺失的so拷贝到压缩包,同时也需要将安装路径下的文件全部拷贝。

  • 知识库上下文不连贯

    将知识库文本内容切分后存入向量数据库,但是查询时有时会出现直接截断的情况,导致上下文不连贯

    解决:使用链式存储,通过记录数据的前后指向来组成一个双向联表,查询时,向前或向后扩展适当的记录。

相关推荐
码力斜杠哥8 分钟前
Rust初习录(6)Rust的 if 玩法
开发语言·python·rust
Rust研习社1 小时前
Rust 的 move 语义,一次讲透
后端·rust·编程语言
不懂的浪漫3 小时前
从看清到理解:CNN、Transformer 与 RAG 背后的 AI 架构迁徙
ai·cnn·llm·transformer·rag
WMYeah5 小时前
【无标题】
前端·rust·抽奖程序·跨平台抽奖程序
qcx238 小时前
混合检索+重排序:当前 RAG 精度提升最成熟的工程路径
算法·ai·llm·agent·rag·agentic
楼兰公子18 小时前
buildroot 在编译rust时裁剪平台类型数量的方法
开发语言·后端·rust
deephub20 小时前
2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑
人工智能·python·大语言模型·rag
老码观察1 天前
数环通iPaaS知识库选型实践:从技术评估到RAGFlow深度调优
人工智能·agent·知识库
Rust研习社1 天前
开源项目里的 deny.toml 是什么?
后端·rust·编程语言
Komorebi_99991 天前
RAG-day9
rag