近期知识库开发过程中遇到的一些问题

我们正在使用Rust开发一个知识库系统,遇到了一些问题,在此记录备忘。

  • 错误:Unable to make method calls because underlying connection is closed

    场景:在docker中调用headless_chrome时出错

    原因:为减小镜像大小,我们使用官方ubuntu镜像,该镜像是最小化镜像,无其他依赖,需要将依赖库复制到镜像中,在复制so文件时,遗漏了/usr/lib/x86_64-linux-gnu/nss下的内容,导致网络连接问题。

  • libreoffice免安装启动

    我们对libreoffice做了适当的精简,实现了通过rust调用libreoffice完成word、excel、ppt等格式到pdf的转换。在此过程中,遇到了不少缺失so的问题。

    解决办法:现在本地安装libreoffice,然后将缺失的so拷贝到压缩包,同时也需要将安装路径下的文件全部拷贝。

  • 知识库上下文不连贯

    将知识库文本内容切分后存入向量数据库,但是查询时有时会出现直接截断的情况,导致上下文不连贯

    解决:使用链式存储,通过记录数据的前后指向来组成一个双向联表,查询时,向前或向后扩展适当的记录。

相关推荐
星马梦缘7 小时前
提示词工程 与 实践 合集
人工智能·rag·提示词工程·mcp
小刘|11 小时前
揭秘RAG:检索增强生成技术解析
langchain·rag
菜到离谱但坚持13 小时前
【小白零基础】RAG+LangChain 搭建私有知识库问答系统(完整可运行代码+超详细教程+避坑指南)
python·langchain·rag
a诠释淡然14 小时前
C++ vs Rust:哪个更适合你的下一个项目?
开发语言·c++·rust
HappyAcmen15 小时前
2.PDF长文档完整读取
python·pdf·rag
Vallelonga17 小时前
Rust 生命周期标注积累
开发语言·rust
星栈17 小时前
Makepad UI 代码怎么读:别被语法吓住
前端·rust
尽兴-18 小时前
2.2 RAG 体系:RAG、Chunk 分块、Rerank 重排、混合检索
rag·混合检索·chunk 分块·rerank 重排
你不是我我19 小时前
【Agent 学习日记】Agent 的记忆是如何设计的?短期记忆和长期记忆有什么区别?
agent·rag
MageGojo19 小时前
基于 Rust + Headless Chrome 的自动化文章发布系统设计与登录态持久化实现
自动化测试·rust·桌面应用·headless-chrome·gpui