datawhale组队学习:第一章习题

1.3 假设我们有三个彩色的盒子r(红色)、b(蓝色)和g(绿色)。盒子r中有3个苹果、4个橙子和3个青柠,盒子b中有1个苹果、1个橙子和0个青柠,盒子g中有 3 个苹果、3 个橙子和 4 个青柠。如果以p®=0.2、p(b)=0.2、p(g)=0.6的概率随机选择一个盒子,并从盒子中取出一个水果(选择盒子中任意水果的概率都相等),那么选中苹果的概率是多少?如果我们发现选中的水果实际上是橙子,那么它来自绿色盒子的概率是多少?

解答:

  • 已知信息:

    • 各盒子中水果数量:

      • 红盒子 r :3 苹果 + 4 橙子 + 3 青柠 = 10 个水果

      • 蓝盒子 b :1 苹果 + 1 橙子 + 0 青柠 = 2 个水果

      • 绿盒子 g :3 苹果 + 3 橙子 + 4 青柠 = 10 个水果

    • 盒子被选中的先验概率

      • P (r)=0.2
      • P (b)=0.2
      • P (g)=0.6
  • 选中苹果的概率:

    根据全概率公式:
    P(苹果)=P(苹果∣r)P(r)+P(苹果∣b)P(b)+P(苹果∣g)P(g) P(苹果)=P(苹果∣r)P(r)+P(苹果∣b)P(b)+P(苹果∣g)P(g) P(苹果)=P(苹果∣r)P(r)+P(苹果∣b)P(b)+P(苹果∣g)P(g)

    计算各条件概率:

    • P (苹果∣r)=3/10
    • P (苹果∣b)=1/2
    • P (苹果∣g)=3/10

    可得:P苹果=0.34

  • 如果我们发现选中的水果实际上是橙子,那么它来自绿色盒子的概率

    根据贝叶斯公式
    P(g∣橙子)=P(橙子∣g)P(g)/P(橙子) P(g∣橙子)= P(橙子∣g)P(g)/P(橙子) P(g∣橙子)=P(橙子∣g)P(g)/P(橙子)

    由全概率公式可得:

    • P (橙子∣r)=4/10=0.4
    • P (橙子∣b)=1/2=0.5
    • P (橙子∣g)=3/10=0.3

​ 可得 P(橙子)=0.4⋅0.2+0.5⋅0.2+0.3⋅0.6=0.08+0.1+0.18=0.36

​ 然后代入贝叶斯公式:P (g∣橙子)=0.5

1.5 利用var[f]= E[(f(x) - E[f(x)])²]证明var[f(x)]满足式var[f]= E[f(x)²]-E[f(x)]²

解答:

  • Y =f (X ),μ =E[Y ]=E[f (X)]

  • 根据方差定义可得:
    var[f(X)]=E[(Y−μ)2] var[f(X)]=E[(Y−μ)^2] var[f(X)]=E[(Y−μ)2]

  • 将平方项展开可得:
    (Y−μ)2=Y2−2μY+μ2 (Y−μ)^2=Y^2−2μY+μ^2 (Y−μ)2=Y2−2μY+μ2

  • 对两边同时取期望可得:
    E[(Y−μ)2]=E[Y2]−2μE[Y]+μ2 E[(Y−μ)^2]=E[Y^2]−2μE[Y]+μ^2 E[(Y−μ)2]=E[Y2]−2μE[Y]+μ2

  • 又因为μ =E[Y ],可得
    E[(Y−μ)2]=E[Y2]−2μ2+μ2=E[Y2]−μ2 E[(Y−μ)^2]=E[Y^2]−2μ^2+μ^2=E[Y^2]−μ^2 E[(Y−μ)2]=E[Y2]−2μ2+μ2=E[Y2]−μ2

  • 带入原式可得:
    var[f]=E[f(x)2]−E[f(x)]2 var[f]= E[f(x)^2]-E[f(x)]^2 var[f]=E[f(x)2]−E[f(x)]2

1.6 证明如果两个变量x和y是独立的,则它们的协方差为零

解答:

  • 协方差定义式:
    Cov(X,Y)=E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y] Cov(X,Y)=E[(X−E[X])(Y−E[Y])] = E[XY]−E[X]E[Y] Cov(X,Y)=E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y]

  • 利用独立性,若X和Y相互独立,则:
    E[XY]=E[X]E[Y] E[XY]=E[X]E[Y] E[XY]=E[X]E[Y]

  • 代入协方差定义即可得:
    Cov(X,Y)=E[XY]−E[X]E[Y]=0 Cov(X,Y)= E[XY]−E[X]E[Y] = 0 Cov(X,Y)=E[XY]−E[X]E[Y]=0

相关推荐
adore.96819 分钟前
3.18 复试学习
学习
留白_33 分钟前
MySQL学习(9)——索引
学习
Echo_NGC22371 小时前
【贝叶斯公式】从先验到后验的概率推演
人工智能·贝叶斯·概率论·扩散模型
请你喝好果汁6411 小时前
生信学习笔记:ArchR 处理小麦单细胞 ATAC-seq 中的细胞数差异与 Embedding 报错调试
学习
jinanwuhuaguo2 小时前
OpenClaw、飞书、Claude Code、Codex:四维AI生态体系的深度解构与颗粒化对比分析
大数据·人工智能·学习·飞书·openclaw
blackicexs2 小时前
第九周第四天
人工智能·深度学习·机器学习
math_learning2 小时前
方法思路推广|EG:基于机器学习的岩石坠落危害下桥梁脆弱性量化
人工智能·机器学习
萨文 摩尔杰2 小时前
GPS原理学习
学习·fpga开发
fengci.2 小时前
ctfshow(web入门)295-300
java·开发语言·学习