第20期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练 Transformer(GPT)、人工智能生成内容(AIGC)以及大型语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

· LMSanitator: Defending Prompt-Tuning Against Task-Agnostic Backdoors

**简介:**LMSanitator是一种检测和删除Transformer模型上与任务无关的后门的新方法。LMSanitator的目标不是直接反转触发器,而是反转任务不可知后门的预定义攻击向量(当输入嵌入触发器时预训练模型的输出),从而实现更好的收敛性能和后门检测精度。

链接: https://arxiv.org/pdf/2308.13904.pdf

· Using ChatGPT as a Static Application Security Testing Tool

**简介:**本文研究了在python源代码中使用ChatGPT进行漏洞检测的可行性。为了实现这一目标,我们将适当的提示以及易受攻击的数据提供给ChatGPT,并将其在两个数据集上的结果与三种广泛使用的静态应用程序安全测试工具(Bandit,Semgrep和SonarQube)的结果进行比较。我们使用ChatGPT进行了不同类型的实验,结果表明ChatGPT降低了假阳性和假阴性率,并且具有用于Python源代码漏洞检测的潜力。

链接: https://arxiv.org/pdf/2308.14434.pdf

· LLM in the Shell: Generative Honeypots

**简介:**本文介绍了一种基于大型语言模型创建动态、逼真的软件蜜罐的新方法。初步结果表明,LLM可以创建可信的动态蜜罐,能够解决以前蜜罐的重要局限性,如确定性响应,缺乏适应性等。

链接: https://arxiv.org/pdf/2309.00155.pdf

· A Comprehensive Overview of Backdoor Attacks in Large Language Models within Communication Networks

**简介:**在这项调查中,我们系统地提出了LLM中使用通信网络的后门攻击的分类,将其分为四大类:输入触发、提示触发、指令触发和演示触发攻击。此外,我们对基准数据集进行了全面的分析。最后,我们确定了潜在的问题和开放的挑战,为未来的研究方向提供了有价值的见解,以增强通信网络中LLM的安全性和完整性。

链接: https://arxiv.org/pdf/2308.14367.pdf

· Red-Teaming Large Language Models using Chain of Utterances for Safety-Alignment

**简介:**大型语言模型(LLM)仅通过优化下一个单词的预测目标,就以其强大的多任务处理能力席卷了世界。随着法学硕士的属性和编码知识的出现,法学硕士产生有害产出的风险增加,使其不适合为公众进行可扩展部署。在这项工作中,我们提出了一个新的安全评估基准RED-EVAL来进行红队攻击。研究表明,即使是广泛部署的模型也容易受到基于话语链(CoU)提示的影响,此外,还证明了RED-EVAL在8个开源LLM中的一致性,在超过86%的红队尝试中产生了有害的响应。

链接: https://arxiv.org/pdf/2308.09662.pdf

· Prompt-Enhanced Software Vulnerability Detection Using ChatGPT

**简介:**本文对不同提示符设计下的ChatGPT软件漏洞检测性能进行了研究。首先,我们对之前的工作进行了补充,对基本提示进行了各种改进。此外,我们还加入了结构和顺序辅助信息来改进提示设计。此外,我们利用ChatGPT记忆多轮对话的能力,设计适合漏洞检测的提示符。我们在两个漏洞数据集上进行了大量的实验,以证明使用chatgpt进行快速增强漏洞检测的有效性。我们还分析了使用chatgpt进行漏洞检测的优点和缺点。

链接: https://arxiv.org/pdf/2308.12697.pdf

相关推荐
yngsqq4 分钟前
CAD 像素点显示图片——CAD二次开发 OpenCV实现
人工智能·opencv·计算机视觉
Luke Ewin15 分钟前
一个基于OpenAI Whisper开发的音视频字幕文件生成工具
人工智能·whisper·音视频·语音识别·asr·语音转写·视频字幕生成
老马啸西风1 小时前
AgentGPT 在浏览器中组装、配置和部署自主 AI 代理 入门介绍
人工智能·ai·openai·agent·robot·deepseek·mcp
京东零售技术1 小时前
京东3D空间视频生成技术探索与应用
人工智能
Jamence1 小时前
多模态大语言模型arxiv论文略读(十六)
人工智能·语言模型·自然语言处理
武汉唯众智创2 小时前
人工智能(机器人)通识实验室解决方案
人工智能·机器人·人工智能实验室·人工智能通识实验室·人工智能通识·机器人通识实验室·机器人实验室
巷9552 小时前
深入理解卷积神经网络(CNN):从原理到实践
人工智能·神经网络·cnn
知来者逆2 小时前
计算机视觉——基于MediaPipe实现人体姿态估计与不良动作检测
人工智能·深度学习·计算机视觉·mediapipe·姿态估计·人体姿态
满天星耶2 小时前
机器学习数据特征处理,鸢尾花案例,数字识别案例
图像处理·人工智能·机器学习·计算机视觉·数据分析·近邻算法