首发!检测你是否被中转站注入提示词攻击!

介绍

项目链接

写这个项目纯粹是抛砖引玉,先把mvp写出来,把我质朴的思路拿出来晒一晒,主要是这方面没人做啊。

除了审查功能,也支持一些ccswitch不支持的,比如模型映射、热切换等,以后会更更多一点,用量啥的。

原理

简单来说就是把流扔给另外一个快速的、可信的大模型审查一遍,比如本地模型或 deepseek-flash

两个审查模式:

  • 被动审查:只接受然后审查,不主动拦截但会有事后的警告
  • 主动拦截(beta):不支持流,扣下来检测没问题再送回去,不太建议用因为会比较影响日常使用,我说实话走个被动发现有问题就别用这个中转了呗

上下文审查模式也是两个:

使用

启动

把项目扔到本地直接 node start 或者运行 bash 命令

访问 http://127.0.0.1:8787/admin

配置模型

这个不用我教了吧,看着配就行,注意了现在比较轻量所以没法自由转 openai 和 a\格式,得自己填好

然后配置一下路由:

记得配置审查模型

正常使用

操作:

  • baseurl 直接填 http://127.0.0.1:8787/
  • apikey 随便填,因为根本没这功能
  • 获取模型列表
  • 开始使用

就这样就行

审查结果

直接翻就行,结果大致是这样:

攻击模拟

攻击模拟是虚拟模型:客户端调用 attack-sim 或 attack-sim/...,网关用选定上游模型生成模拟响应,再走常规链路,最后生成报告。

选模式试试就好了。

注意攻击模拟的上游模型格式要和你要测试的客户端的格式匹配,比如claude code就用a\格式的。

开发

改就行,我把所有技术设计文档都扔项目上了,期待能有更好的方案。

相关推荐
IT_陈寒41 分钟前
Redis内存爆了,原来我漏掉了这个致命配置
前端·人工智能·后端
fliter1 小时前
最后一块拼图:用 bitvec 构造 IPv4 包,真正做出自己的 Ping
后端
fliter2 小时前
用 Rust 解析并生成 ICMP 包:checksum、nom 与 cookie-factory
后端
蝎子莱莱爱打怪2 小时前
XZLL-IM干货系列 03|消息 ID 设计:一个 UUID 搞不定的事,我用两个 ID 解决了
后端·面试·开源
fliter2 小时前
从 panic 到 Result:用 Rust 重新整理一个 ping 项目的错误处理
后端
森蓝情丶3 小时前
我给 AI 搭了个法庭:一个前端仔的 LangGraph 实战全记录
前端·后端
JensCS猿3 小时前
从 Spring Boot 回看 SSM 框架:手动挡与自动挡的驾驶哲学
后端
爱勇宝3 小时前
干了近 8 年,一夜之间被裁:AI 时代,程序员最该害怕的不是 AI
前端·后端·程序员
科米米3 小时前
嵌入式日志模块
后端
血小溅4 小时前
三大 AI 编码框架深度对比:GSD vs OpenSpec vs Superpowers
人工智能·后端