构造可靠的RAG应用—用户鉴权与输入

这部分笔记是关于RAG系统中用户鉴权与输入部分(下一篇关于文档索引与存储),挺适合作为checklist用于对自己的系统查漏补缺的,同样先放一张整体的架构图:

1、用户鉴权

用户鉴权是最基础的,supabase、firebase、aws cognito都能实现,其中也细分为好几个部分:

  • 访问控制:通过了鉴权的用户才能使用本系统
  • 数据安全:未授权的用户不能访问机密信息,防止数据泄露
  • 用户隐私:只有本用户才能访问自己的隐私数据
  • 合规:用户数据与隐私需要满足法律规定
  • 责任归属:任何操作都需要关联到具体的用户上,如果有可以操作可以迅速定位
  • 个性化:允许用户进行一些preference的设置

2、输入防护

当用户输入敏感信息或者有害信息的时候需要进行防护,可以用Llama Guard、Sagemaker实现,细分为以下几个部分:

  • 匿名化:用户的输入中如果有个人隐私信息需要将其去除掉(例如名字、邮箱等)
  • 限制子字符串:防止sql注入等攻击
  • 限制主题:比如对于国内政治相关的不能聊,懂得都懂
  • 限制代码:防止可执行的代码注入
  • 限制语言:最好对语言也进行限制,不然容易出现错误的回答
  • 检测prompt注入:对于想注入prompt,将llm带歪的输入也要进行限制
  • 限制token数量:防止成本太高或者超了context window

3、重写查询语句

当用户的输入能通过输入防护之后,还需要对其查询语句进行重写,因为用户的输入可能会很模糊,或者需要一些特定的上下文信息。下面有一些具体的方法:

  • 基于历史的重写:例如["a和b哪个更好?","比较这两者"]这两个查询,后者应该被重写为"比较a和b"
  • 创建子查询:例如"比较a和b"这个查询,通过创造"a的特点是什么"+"b的特点是什么"这两个更加具体的子查询效果通常会更好
  • 创建相似的查询:通过同义词、领域知识等方式创造多个相似的查询语句可以增加检索到正确文档的概率,例如对"a的特点是什么"创造相似的语句:"a的缺点和优点是什么"

附原文:www.rungalileo.io/blog/master...

相关推荐
Linux猿18 分钟前
828华为云征文 | 云服务器Flexus X实例:one-api 部署,支持众多大模型
服务器·大模型·llm·华为云·flexus云服务器x实例·华为云服务器·one-api
知来者逆1 小时前
ChemChat——大语言模型与化学的未来,以及整合外部工具和聊天机器人的潜力
人工智能·gpt·语言模型·自然语言处理·机器人·llm·大语言模型
AI领航者1 小时前
大型语言模型的结构性幻觉:不可避免的局限性
人工智能·语言模型·自然语言处理·llm·大语言模型·ai大模型·大模型幻觉
赚钱给孩子买茅台喝2 小时前
智能BI项目第五期
aigc·springboot·ai编程
学习前端的小z4 小时前
【AI视频】Runway:Gen-2 运镜详解
人工智能·aigc·音视频
AI王也5 小时前
ChatGPT 4o 使用指南 (9月更新)
人工智能·chatgpt·prompt·aigc
敲上瘾6 小时前
多态的使用和原理(c++详解)
开发语言·数据结构·c++·单片机·aigc·多态·模拟
洛阳泰山7 小时前
Llamaindex 使用过程中的常见问题 (FAQ)
java·服务器·数据库·python·llm·rag·llamaindex
chenkangck5010 小时前
AI大模型之旅--milvus向量库安装
人工智能·aigc·milvus
学习前端的小z10 小时前
【AI视频】Runway:Gen-2 图文生视频与运动模式详解
人工智能·aigc·音视频