概率论-独立同分布

独立同分布(i.i.d.,Independent and Identically Distributed)

随机变量序列中每个变量相互独立服从同一概率分布

维度 说明
独立 每个样本的取值不影响其他样本。例如,抛硬币10次,第5次结果不影响第6次。
同分布 所有样本来自同一个概率分布。例如,抛同一枚公平硬币10次,每次正面概率均为0.5。

例子

  1. 抛硬币

    连续抛掷同一枚公平硬币10次,每次结果独立且正面概率恒为0.5 → 这是i.i.d.。

  2. 非i.i.d.的反例

    • 非独立:第一次抛硬币的结果决定第二次是否抛硬币(如"正面则停止")。
    • 非同分布:前5次用公平硬币,后5次改用正面概率0.8的偏硬币。

扩展

为什么机器学习需要i.i.d.?

  • 训练集与测试集需同分布:若训练数据来自"夏季西瓜",测试数据却是"冬季西瓜",模型会失效(分布偏移)。
  • 理论保证:泛化误差界(如Hoeffding不等式)的推导依赖i.i.d.假设。

真实数据常违反i.i.d.(如时间序列、用户行为随时间变化),此时需领域自适应重加权等技术修正。

相关推荐
sunfove4 小时前
贝叶斯模型 (Bayesian Model) 的直觉与硬核原理
人工智能·机器学习·概率论
sunfove7 小时前
上帝的骰子:概率论核心概念、分布与极限定理的直觉图解
概率论
张祥6422889041 天前
数理统计基础一
人工智能·机器学习·概率论
Zhibang Yue1 天前
非参数统计基础1——Pearson检验
统计·概率论·数理统计
ballball~~2 天前
正态(高斯)分布(Gaussian distribution)
算法·概率论
AI科技星2 天前
引力场与磁场的几何统一:磁矢势方程的第一性原理推导、验证与诠释
数据结构·人工智能·经验分享·线性代数·算法·计算机视觉·概率论
Niuguangshuo3 天前
高斯分布的加权和 vs. 加权混合
概率论
Niuguangshuo3 天前
随机变量及其分布:从离散到连续,深入理解概率模型的基础
概率论
Z_Jiang3 天前
金融投资 的 小游戏:海边躺平
经验分享·金融·概率论·程序员创富
liliangcsdn5 天前
全方差公式在DDIM中的应用示例
概率论