概率论-独立同分布

独立同分布(i.i.d.,Independent and Identically Distributed)

随机变量序列中每个变量相互独立服从同一概率分布

维度 说明
独立 每个样本的取值不影响其他样本。例如,抛硬币10次,第5次结果不影响第6次。
同分布 所有样本来自同一个概率分布。例如,抛同一枚公平硬币10次,每次正面概率均为0.5。

例子

  1. 抛硬币

    连续抛掷同一枚公平硬币10次,每次结果独立且正面概率恒为0.5 → 这是i.i.d.。

  2. 非i.i.d.的反例

    • 非独立:第一次抛硬币的结果决定第二次是否抛硬币(如"正面则停止")。
    • 非同分布:前5次用公平硬币,后5次改用正面概率0.8的偏硬币。

扩展

为什么机器学习需要i.i.d.?

  • 训练集与测试集需同分布:若训练数据来自"夏季西瓜",测试数据却是"冬季西瓜",模型会失效(分布偏移)。
  • 理论保证:泛化误差界(如Hoeffding不等式)的推导依赖i.i.d.假设。

真实数据常违反i.i.d.(如时间序列、用户行为随时间变化),此时需领域自适应重加权等技术修正。

相关推荐
sensen_kiss1 天前
INT305 Machine Learning 机器学习 Pt.9 Probabilistic Models(概率模型)
人工智能·机器学习·概率论
AI大模型学徒1 天前
NLP基础(八)_马尔可夫模型
算法·机器学习·自然语言处理·nlp·概率论·马尔可夫模型
谅望者3 天前
数据分析笔记08:Python编程基础-数据类型与变量
数据库·笔记·python·数据分析·概率论
醒过来摸鱼5 天前
9.11 傅里叶变换家族介绍
线性代数·算法·概率论
ChoSeitaku7 天前
线代强化NO7|秩|矩阵的秩|向量组的秩|极大线性无关组|公式
线性代数·矩阵·概率论
Cathy Bryant7 天前
信息论(五):联合熵与条件熵
人工智能·笔记·机器学习·数学建模·概率论
谅望者7 天前
数据分析笔记03:概率分布理论
笔记·数据分析·概率论
醒过来摸鱼8 天前
多重组合问题与矩阵配额问题
线性代数·矩阵·概率论
Jie Qiao9 天前
为什么“随机变量”是个函数?为什么“函数相加”会产生高斯分布?
概率论
jz_ddk11 天前
[数学基础] 瑞利分布:数学原理、物理意义及Python实验
开发语言·python·数学·概率论·信号分析