【学习笔记】对抗机器学习

Adversarial Machine Learning

机器学习系统中的攻击和防御

对抗环境下的无监督学习

在对抗环境下,无监督学习的两个常见用途是攻击聚类和异常检测。

强化学习

马尔可夫决策过程(Markov Decision Process,MDP)为强化学习(Reinforcement Learning,RL)提供数学基础。

对机器学习的攻击类型

沿着三个维度对攻击进行分类:时机、信息和目标。

时机

在对攻击进行建模时,首先考虑的是攻击发生的时间。

这种考虑导致以下共同的二分法,这是对机器学习攻击的核心:

对模型的攻击(其中规避攻击是最典型的情况),对模型的攻击或者更准确地说,对所学模型做出决策的攻击,假设模型已经被学习,攻击者现在要么改变其行为,要么改变观察到的环境,以使模型做出错误的预测。

对算法的攻击(通过成为投毒攻击),投毒攻击发生在模型接受训练之前,修改了用于训练的部分数据。

信息

对攻击进行建模的第二个重要的问题是,攻击者拥有关于学习模型或算法的哪些信息,这一区别通过被提炼为白盒攻击和黑盒攻击。

白盒攻击假定模型(在对决策进行攻击的情况下)或算法(在投毒攻击中)被对手完全了解;

黑盒攻击中对手对这些信息了解有限或没有,尽可能通过查询间接获得一些信息。

目标

攻击者可能有不同的攻击原因,例如规避检测或者降低算法的可信度。

由此区分了两个类攻击目标:针对性攻击和对学习方法可靠性的攻击(简称可靠性攻击)。

在针对性攻击中,攻击者的目标是在特定性质的特定实例上造成错误。

可靠性攻击旨在通过最大化预测误差来降低学习系统的感知可靠性。

相关推荐
Chris _data37 分钟前
c#学习WPF笔记(一)
学习·c#·wpf
天天进步201539 分钟前
Python全栈项目--基于机器学习的异常检测系统
开发语言·python·机器学习
AOwhisky8 小时前
Redis 学习笔记(第三期):持久化与主从复制
运维·数据库·redis·笔记·学习·云计算
问心无愧05138 小时前
ctf show web入门160 161
前端·笔记
啦啦啦_99998 小时前
5. 迁移学习
人工智能·机器学习·迁移学习
Tbisnic9 小时前
AI大模型学习第十一天:技术选型、安全防护与金融实战
python·学习·ai·大模型·提示词工程
xmtxz10 小时前
计算机网络基础课程学习心得:从理论抽象到硬核实战的进阶之路
运维·学习
YM52e12 小时前
男孩子在外自我保护指南——用鸿蒙 ArkTS 构建交互式安全教育应用
学习·安全·华为·harmonyos·鸿蒙·鸿蒙系统
aXin_ya12 小时前
Ai Vibecoding学习(各个AI的讲解)
学习
乘~风13 小时前
408考研-计组-1.2计算机系统层次结构笔记+1.3计算机性能指标
笔记·考研·408