datawhale组队学习:第一章习题

1.3 假设我们有三个彩色的盒子r(红色)、b(蓝色)和g(绿色)。盒子r中有3个苹果、4个橙子和3个青柠,盒子b中有1个苹果、1个橙子和0个青柠,盒子g中有 3 个苹果、3 个橙子和 4 个青柠。如果以p®=0.2、p(b)=0.2、p(g)=0.6的概率随机选择一个盒子,并从盒子中取出一个水果(选择盒子中任意水果的概率都相等),那么选中苹果的概率是多少?如果我们发现选中的水果实际上是橙子,那么它来自绿色盒子的概率是多少?

解答:

  • 已知信息:

    • 各盒子中水果数量:

      • 红盒子 r :3 苹果 + 4 橙子 + 3 青柠 = 10 个水果

      • 蓝盒子 b :1 苹果 + 1 橙子 + 0 青柠 = 2 个水果

      • 绿盒子 g :3 苹果 + 3 橙子 + 4 青柠 = 10 个水果

    • 盒子被选中的先验概率

      • P (r)=0.2
      • P (b)=0.2
      • P (g)=0.6
  • 选中苹果的概率:

    根据全概率公式:
    P(苹果)=P(苹果∣r)P(r)+P(苹果∣b)P(b)+P(苹果∣g)P(g) P(苹果)=P(苹果∣r)P(r)+P(苹果∣b)P(b)+P(苹果∣g)P(g) P(苹果)=P(苹果∣r)P(r)+P(苹果∣b)P(b)+P(苹果∣g)P(g)

    计算各条件概率:

    • P (苹果∣r)=3/10
    • P (苹果∣b)=1/2
    • P (苹果∣g)=3/10

    可得:P苹果=0.34

  • 如果我们发现选中的水果实际上是橙子,那么它来自绿色盒子的概率

    根据贝叶斯公式
    P(g∣橙子)=P(橙子∣g)P(g)/P(橙子) P(g∣橙子)= P(橙子∣g)P(g)/P(橙子) P(g∣橙子)=P(橙子∣g)P(g)/P(橙子)

    由全概率公式可得:

    • P (橙子∣r)=4/10=0.4
    • P (橙子∣b)=1/2=0.5
    • P (橙子∣g)=3/10=0.3

​ 可得 P(橙子)=0.4⋅0.2+0.5⋅0.2+0.3⋅0.6=0.08+0.1+0.18=0.36

​ 然后代入贝叶斯公式:P (g∣橙子)=0.5

1.5 利用var[f]= E[(f(x) - E[f(x)])²]证明var[f(x)]满足式var[f]= E[f(x)²]-E[f(x)]²

解答:

  • Y =f (X ),μ =E[Y ]=E[f (X)]

  • 根据方差定义可得:
    var[f(X)]=E[(Y−μ)2] var[f(X)]=E[(Y−μ)^2] var[f(X)]=E[(Y−μ)2]

  • 将平方项展开可得:
    (Y−μ)2=Y2−2μY+μ2 (Y−μ)^2=Y^2−2μY+μ^2 (Y−μ)2=Y2−2μY+μ2

  • 对两边同时取期望可得:
    E[(Y−μ)2]=E[Y2]−2μE[Y]+μ2 E[(Y−μ)^2]=E[Y^2]−2μE[Y]+μ^2 E[(Y−μ)2]=E[Y2]−2μE[Y]+μ2

  • 又因为μ =E[Y ],可得
    E[(Y−μ)2]=E[Y2]−2μ2+μ2=E[Y2]−μ2 E[(Y−μ)^2]=E[Y^2]−2μ^2+μ^2=E[Y^2]−μ^2 E[(Y−μ)2]=E[Y2]−2μ2+μ2=E[Y2]−μ2

  • 带入原式可得:
    var[f]=E[f(x)2]−E[f(x)]2 var[f]= E[f(x)^2]-E[f(x)]^2 var[f]=E[f(x)2]−E[f(x)]2

1.6 证明如果两个变量x和y是独立的,则它们的协方差为零

解答:

  • 协方差定义式:
    Cov(X,Y)=E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y] Cov(X,Y)=E[(X−E[X])(Y−E[Y])] = E[XY]−E[X]E[Y] Cov(X,Y)=E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y]

  • 利用独立性,若X和Y相互独立,则:
    E[XY]=E[X]E[Y] E[XY]=E[X]E[Y] E[XY]=E[X]E[Y]

  • 代入协方差定义即可得:
    Cov(X,Y)=E[XY]−E[X]E[Y]=0 Cov(X,Y)= E[XY]−E[X]E[Y] = 0 Cov(X,Y)=E[XY]−E[X]E[Y]=0

相关推荐
AI科技星20 分钟前
电场起源的几何革命:变化的引力场产生电场方程的第一性原理推导、验证与统一性意义
开发语言·人工智能·线性代数·算法·机器学习·数学建模
九河云23 分钟前
华为云SDRS跨Region双活:筑牢证券核心系统零中断防线
大数据·人工智能·安全·机器学习·华为云
BullSmall25 分钟前
《逍遥游》
学习
奔波霸的伶俐虫25 分钟前
spring boot集成kafka学习
spring boot·学习·kafka
CCPC不拿奖不改名27 分钟前
面向对象编程:继承与多态+面试习题
开发语言·数据结构·python·学习·面试·职场和发展
GHL28427109027 分钟前
通义千问的 Function Call - demo学习
学习·ai·ai编程
WangUnionpub28 分钟前
2026 国自然基金申请全周期时间线
大数据·人工智能·物联网·机器学习·计算机视觉
知识分享小能手28 分钟前
Ubuntu入门学习教程,从入门到精通,Ubuntu 22.04 中的服务器 —— 知识点详解 (22)
服务器·学习·ubuntu
慎独41329 分钟前
记忆力革命:学习力的核心与其目脑力的科技探索
科技·学习
2301_8002561129 分钟前
R-Tree创建与遍历,R-Tree在4类空间查询中的应用,实现4类空间查询的各类算法[第8章]
数据库·算法·机器学习·postgresql·r-tree