第20期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练 Transformer(GPT)、人工智能生成内容(AIGC)以及大型语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

· LMSanitator: Defending Prompt-Tuning Against Task-Agnostic Backdoors

**简介:**LMSanitator是一种检测和删除Transformer模型上与任务无关的后门的新方法。LMSanitator的目标不是直接反转触发器,而是反转任务不可知后门的预定义攻击向量(当输入嵌入触发器时预训练模型的输出),从而实现更好的收敛性能和后门检测精度。

链接: https://arxiv.org/pdf/2308.13904.pdf

· Using ChatGPT as a Static Application Security Testing Tool

**简介:**本文研究了在python源代码中使用ChatGPT进行漏洞检测的可行性。为了实现这一目标,我们将适当的提示以及易受攻击的数据提供给ChatGPT,并将其在两个数据集上的结果与三种广泛使用的静态应用程序安全测试工具(Bandit,Semgrep和SonarQube)的结果进行比较。我们使用ChatGPT进行了不同类型的实验,结果表明ChatGPT降低了假阳性和假阴性率,并且具有用于Python源代码漏洞检测的潜力。

链接: https://arxiv.org/pdf/2308.14434.pdf

· LLM in the Shell: Generative Honeypots

**简介:**本文介绍了一种基于大型语言模型创建动态、逼真的软件蜜罐的新方法。初步结果表明,LLM可以创建可信的动态蜜罐,能够解决以前蜜罐的重要局限性,如确定性响应,缺乏适应性等。

链接: https://arxiv.org/pdf/2309.00155.pdf

· A Comprehensive Overview of Backdoor Attacks in Large Language Models within Communication Networks

**简介:**在这项调查中,我们系统地提出了LLM中使用通信网络的后门攻击的分类,将其分为四大类:输入触发、提示触发、指令触发和演示触发攻击。此外,我们对基准数据集进行了全面的分析。最后,我们确定了潜在的问题和开放的挑战,为未来的研究方向提供了有价值的见解,以增强通信网络中LLM的安全性和完整性。

链接: https://arxiv.org/pdf/2308.14367.pdf

· Red-Teaming Large Language Models using Chain of Utterances for Safety-Alignment

**简介:**大型语言模型(LLM)仅通过优化下一个单词的预测目标,就以其强大的多任务处理能力席卷了世界。随着法学硕士的属性和编码知识的出现,法学硕士产生有害产出的风险增加,使其不适合为公众进行可扩展部署。在这项工作中,我们提出了一个新的安全评估基准RED-EVAL来进行红队攻击。研究表明,即使是广泛部署的模型也容易受到基于话语链(CoU)提示的影响,此外,还证明了RED-EVAL在8个开源LLM中的一致性,在超过86%的红队尝试中产生了有害的响应。

链接: https://arxiv.org/pdf/2308.09662.pdf

· Prompt-Enhanced Software Vulnerability Detection Using ChatGPT

**简介:**本文对不同提示符设计下的ChatGPT软件漏洞检测性能进行了研究。首先,我们对之前的工作进行了补充,对基本提示进行了各种改进。此外,我们还加入了结构和顺序辅助信息来改进提示设计。此外,我们利用ChatGPT记忆多轮对话的能力,设计适合漏洞检测的提示符。我们在两个漏洞数据集上进行了大量的实验,以证明使用chatgpt进行快速增强漏洞检测的有效性。我们还分析了使用chatgpt进行漏洞检测的优点和缺点。

链接: https://arxiv.org/pdf/2308.12697.pdf

相关推荐
qzhqbb1 小时前
基于统计方法的语言模型
人工智能·语言模型·easyui
冷眼看人间恩怨2 小时前
【话题讨论】AI大模型重塑软件开发:定义、应用、优势与挑战
人工智能·ai编程·软件开发
2401_883041082 小时前
新锐品牌电商代运营公司都有哪些?
大数据·人工智能
AI极客菌3 小时前
Controlnet作者新作IC-light V2:基于FLUX训练,支持处理风格化图像,细节远高于SD1.5。
人工智能·计算机视觉·ai作画·stable diffusion·aigc·flux·人工智能作画
阿_旭3 小时前
一文读懂| 自注意力与交叉注意力机制在计算机视觉中作用与基本原理
人工智能·深度学习·计算机视觉·cross-attention·self-attention
王哈哈^_^3 小时前
【数据集】【YOLO】【目标检测】交通事故识别数据集 8939 张,YOLO道路事故目标检测实战训练教程!
前端·人工智能·深度学习·yolo·目标检测·计算机视觉·pyqt
Power20246664 小时前
NLP论文速读|LongReward:基于AI反馈来提升长上下文大语言模型
人工智能·深度学习·机器学习·自然语言处理·nlp
数据猎手小k4 小时前
AIDOVECL数据集:包含超过15000张AI生成的车辆图像数据集,目的解决旨在解决眼水平分类和定位问题。
人工智能·分类·数据挖掘
好奇龙猫4 小时前
【学习AI-相关路程-mnist手写数字分类-win-硬件:windows-自我学习AI-实验步骤-全连接神经网络(BPnetwork)-操作流程(3) 】
人工智能·算法
沉下心来学鲁班4 小时前
复现LLM:带你从零认识语言模型
人工智能·语言模型