概率论-独立同分布

独立同分布(i.i.d.,Independent and Identically Distributed)

随机变量序列中每个变量相互独立服从同一概率分布

维度 说明
独立 每个样本的取值不影响其他样本。例如,抛硬币10次,第5次结果不影响第6次。
同分布 所有样本来自同一个概率分布。例如,抛同一枚公平硬币10次,每次正面概率均为0.5。

例子

  1. 抛硬币

    连续抛掷同一枚公平硬币10次,每次结果独立且正面概率恒为0.5 → 这是i.i.d.。

  2. 非i.i.d.的反例

    • 非独立:第一次抛硬币的结果决定第二次是否抛硬币(如"正面则停止")。
    • 非同分布:前5次用公平硬币,后5次改用正面概率0.8的偏硬币。

扩展

为什么机器学习需要i.i.d.?

  • 训练集与测试集需同分布:若训练数据来自"夏季西瓜",测试数据却是"冬季西瓜",模型会失效(分布偏移)。
  • 理论保证:泛化误差界(如Hoeffding不等式)的推导依赖i.i.d.假设。

真实数据常违反i.i.d.(如时间序列、用户行为随时间变化),此时需领域自适应重加权等技术修正。

相关推荐
F_D_Z4 天前
【EM算法】三硬币模型
算法·机器学习·概率论·em算法·极大似然估计
金色光环7 天前
概率论:理解区间估计【超详细笔记】
笔记·数学·概率论·数理统计·区间估计
微小冷13 天前
二关节机器人系统模型推导
线性代数·机器人·概率论·推导·拉格朗日函数·二关节机器人·机器人控制系统的设计
软件开发技术深度爱好者13 天前
概率中“都发生”和“至少一个”问题的解答
概率论·数学广角
FF-Studio15 天前
【硬核数学】3. AI如何应对不确定性?概率论为模型注入“灵魂”《从零构建机器学习、深度学习到LLM的数学认知》
大数据·人工智能·深度学习·机器学习·数学建模·自然语言处理·概率论
如果你想拥有什么先让自己配得上拥有25 天前
概率论中的生日问题,违背直觉?如何计算? 以及从人性金融的角度分析如何违背直觉的?
金融·概率论
云博客-资源宝25 天前
Excel函数大全
机器学习·excel·概率论
爱学习的capoo1 个月前
【解析法与几何法在阻尼比设计】自控
线性代数·机器学习·概率论
TomcatLikeYou1 个月前
概率论中的基本定义(事件,期望,信息量,香农熵等)
深度学习·机器学习·概率论