【学习笔记】对抗机器学习

Adversarial Machine Learning

机器学习系统中的攻击和防御

对抗环境下的无监督学习

在对抗环境下,无监督学习的两个常见用途是攻击聚类和异常检测。

强化学习

马尔可夫决策过程(Markov Decision Process,MDP)为强化学习(Reinforcement Learning,RL)提供数学基础。

对机器学习的攻击类型

沿着三个维度对攻击进行分类:时机、信息和目标。

时机

在对攻击进行建模时,首先考虑的是攻击发生的时间。

这种考虑导致以下共同的二分法,这是对机器学习攻击的核心:

对模型的攻击(其中规避攻击是最典型的情况),对模型的攻击或者更准确地说,对所学模型做出决策的攻击,假设模型已经被学习,攻击者现在要么改变其行为,要么改变观察到的环境,以使模型做出错误的预测。

对算法的攻击(通过成为投毒攻击),投毒攻击发生在模型接受训练之前,修改了用于训练的部分数据。

信息

对攻击进行建模的第二个重要的问题是,攻击者拥有关于学习模型或算法的哪些信息,这一区别通过被提炼为白盒攻击和黑盒攻击。

白盒攻击假定模型(在对决策进行攻击的情况下)或算法(在投毒攻击中)被对手完全了解;

黑盒攻击中对手对这些信息了解有限或没有,尽可能通过查询间接获得一些信息。

目标

攻击者可能有不同的攻击原因,例如规避检测或者降低算法的可信度。

由此区分了两个类攻击目标:针对性攻击和对学习方法可靠性的攻击(简称可靠性攻击)。

在针对性攻击中,攻击者的目标是在特定性质的特定实例上造成错误。

可靠性攻击旨在通过最大化预测误差来降低学习系统的感知可靠性。

相关推荐
Yunzenn1 分钟前
深度分析字节最新研究cola-DLM第 01 章:语言生成的三次范式之争 —— 从 RNN 到 AR 到扩散
linux·人工智能·rnn·深度学习·机器学习·架构·transformer
楼田莉子2 分钟前
C#学习之C#入门学习
开发语言·后端·学习·c#
yoona10203 分钟前
Web3 基础概念笔记:理解测试网交易、合约调用、钱包确认与链上验证
笔记·web3·区块链
hef2884 分钟前
用REGEXP函数简化城市销售数据统计的实践与学习路径
学习
Harm灬小海7 分钟前
【云计算学习之路】学习Centos7系统:Linux磁盘管理
linux·运维·服务器·学习·云计算
chushiyunen9 分钟前
python使用笔记(linux环境)
linux·笔记·python
三品吉他手会点灯10 分钟前
C语言学习笔记 - 41.数据类型 - scanf函数核心知识点复习
c语言·开发语言·笔记·学习
撩得Android一次心动11 分钟前
C语言基础笔记3【个人用】
android·c语言·开发语言·笔记
QBoson12 分钟前
Nature:破译蛋白质隐形能量景观,从“看结构”到“控动态”的革命
人工智能·机器学习
清平乐的技术专栏12 分钟前
【FlinkSQL笔记】(三)Flink SQL 核心重难点(窗口函数、水印)
笔记·sql·flink