概率论-独立同分布

独立同分布(i.i.d.,Independent and Identically Distributed)

随机变量序列中每个变量相互独立服从同一概率分布

维度 说明
独立 每个样本的取值不影响其他样本。例如,抛硬币10次,第5次结果不影响第6次。
同分布 所有样本来自同一个概率分布。例如,抛同一枚公平硬币10次,每次正面概率均为0.5。

例子

  1. 抛硬币

    连续抛掷同一枚公平硬币10次,每次结果独立且正面概率恒为0.5 → 这是i.i.d.。

  2. 非i.i.d.的反例

    • 非独立:第一次抛硬币的结果决定第二次是否抛硬币(如"正面则停止")。
    • 非同分布:前5次用公平硬币,后5次改用正面概率0.8的偏硬币。

扩展

为什么机器学习需要i.i.d.?

  • 训练集与测试集需同分布:若训练数据来自"夏季西瓜",测试数据却是"冬季西瓜",模型会失效(分布偏移)。
  • 理论保证:泛化误差界(如Hoeffding不等式)的推导依赖i.i.d.假设。

真实数据常违反i.i.d.(如时间序列、用户行为随时间变化),此时需领域自适应重加权等技术修正。

相关推荐
明月照山海-3 天前
机器学习周报十三
人工智能·机器学习·概率论
北京地铁1号线4 天前
概率统计面试题1:随机抛掷的点到圆心距离的期望
概率论
ratbag6720134 天前
概率论与数理统计专业重点学哪些知识?
概率论
Yingjun Mo5 天前
1. 统计推断-基于神经网络与Langevin扩散的自适应潜变量建模与优化
人工智能·神经网络·算法·机器学习·概率论
图先5 天前
概率论第五讲—大数定律与中心极限定理
概率论
图先8 天前
概率论第六讲—数理统计
概率论
西猫雷婶9 天前
scikit-learn/sklearn学习|广义线性回归损失函数的基本表达式
深度学习·神经网络·学习·机器学习·线性回归·scikit-learn·概率论
xz2024102****11 天前
最大似然估计:损失函数的底层数学原理
人工智能·算法·机器学习·概率论
kingmax5421200811 天前
概率与数理统计公式及结论汇总
人工智能·机器学习·概率论
西猫雷婶12 天前
神经网络|(十九)概率论基础知识-伽马函数·下
人工智能·深度学习·神经网络·机器学习·回归·scikit-learn·概率论