【论文阅读】-《Formalizing and Benchmarking Prompt Injection Attacks and Defenses》提示注入攻击旨在将恶意指令/数据注入到 LLM 集成应用的输入中,从而使应用产生攻击者期望的结果。现有工作仅限于案例研究。因此,文献中缺乏对提示注入攻击及其防御的系统性理解。本文旨在弥补这一空白。具体而言,我们提出了一个框架来形式化提示注入攻击。现有攻击是我们框架中的特例。此外,基于我们的框架,我们通过组合现有攻击设计了一种新的攻击。利用我们的框架,我们对 5 种提示注入攻击和 10 种防御措施在 10 个 LLM 和 7 个任务上进行了系统评估。我们的工作为定量评估未来的提示注入攻击和防御提供了一个通用