ai安全

小菜日记^_^9 天前
论文阅读·人工智能·深度学习·sp·ai安全·backdoor 后门攻击·安全四大
BEAGLE: Forensics of Deep Learning Backdoor Attack for Better Defense(论文阅读)将论文中内容精简了一下,并做了下总结。目录摘要背景介绍Contribution:提出的方法:BEAGLE的核心目标
DaLi Yao22 天前
人工智能·算法·语言模型·自然语言处理·提示词攻击·ai安全·注入攻击
【论文速读】Optimization-based Prompt Injection Attack to LLM-as-a-JudgeLLM-as-a-Judge 利用一个大型语言模型(LLM)从一组候选答案中选择给定问题的最佳回答。LLM-as-a-Judge 有许多应用,例如 LLM 驱动的搜索、带有 AI 反馈的强化学习(RLAIF)和工具选择。在这项工作中,提出了 JudgeDeceiver,这是一种针对 LLM-as-a-Judge 的基于优化的提示注入攻击。JudgeDeceiver 将一个精心设计的序列注入到攻击者控制的候选回答中,使得 LLM-as-a-Judge 无论其他候选回答是什么,都会为攻击者选择的问题选择该候选
云安全联盟大中华区25 天前
云安全·ai安全·csa研究成果
CSA发布 | 医疗行业变革下的治理、风险管理与合规性策略随着医疗行业的迅猛发展,云计算、人工智能(AI)、区块链和物联网(IoT)等新兴技术正在推动行业发生深刻变革。这些技术在提升医疗服务质量与效率的同时,也伴随着数据安全、合规性和风险管理方面的新挑战。医疗保健机构(HDO)在充分利用这些技术时,必须确保数据的安全性与合规性,这使得建立和优化治理、风险管理与合规性(GRC)框架变得至关重要。为帮助医疗保健行业深入理解并有效应对这些风险,云安全联盟大中华区发布了《医疗保健中的信息技术治理、风险与合规(第二版)》报告。
合天网安实验室2 个月前
深度学习·后门攻击·人工智能安全·ai安全
深度学习后门攻击分析与实现(二)在本系列的第一部分中,我们已经掌握了深度学习中的后门攻击的特点以及基础的攻击方式,现在我们在第二部分中首先来学习深度学习后门攻击在传统网络空间安全中的应用。然后再来分析与实现一些颇具特点的深度学习后门攻击方式。
智源研究院官方账号2 个月前
人工智能·ai安全
签署《AI安全国际对话威尼斯共识》 智源持续推动人工智能安全发展近日,由AI安全国际论坛(Safe AI Forum)和博古睿研究院(Berggruen Institute) 共同举办的第三届国际AI安全对话(International Dialogues on AI Safety)在威尼斯举办。图灵奖得主Yoshua Bengio、姚期智教授,加州大学伯克利分校教授Stuart Russell,北京智源人工智能研究院创始理事长张宏江博士,清华大学讲席教授、智能产业研究院院长张亚勤等多位全球顶尖的人工智能科学家出席活动,经过为期三天的讨论,共同达成了《AI安全国际对话
云安全联盟大中华区5 个月前
人工智能·ai安全·csa认证培训·caisp人工智能安全专家
全球视角下的AI安全挑战:面向未来的准备云安全联盟大中华区即将推出人工智能安全认证专家(Certified Artificial Intelligence Security Professional,CAISP)培训及认证计划,将在Q3全面上线。
云安全联盟大中华区7 个月前
数字安全·ai安全
国内首发 | CSA大中华区启动《AI安全产业图谱(2024)》调研在人工智能(AI)技术的快速发展浪潮中,AI安全已成为全球关注的焦点。为应对AI安全带来的挑战,确保AI技术的健康发展,全球范围内的研究机构、企业和技术社区都在积极探索解决方案。
Jay 179 个月前
python·ai安全·提示词注入
第七届西湖论剑·中国杭州网络安全技能大赛 AI 回声海螺 WP开题,提示输入密码给FLAG。这个回声海螺应该是个AI,就是复读机,应该是想办法从中骗出密码。感觉这题不像是AI,也没用啥模型,应该是WEB。或者是说类似于AI的提示词注入