【小白学机器学习16】 概率论的世界观2: 从正态分布去认识世界

目录

[1 从正态分布说起](#1 从正态分布说起)

[1.1 正态分布的定义](#1.1 正态分布的定义)

[1.2 正态分布的名字](#1.2 正态分布的名字)

[1.3 正态分布的广泛,和基础性](#1.3 正态分布的广泛,和基础性)

[2 正态分布的公式和图形](#2 正态分布的公式和图形)

[2.1 正态分布](#2.1 正态分布)

[2.2 标准正态分布](#2.2 标准正态分布)

[3 正态分布的认识的3个层次](#3 正态分布的认识的3个层次)

[3.1 第1层次:个体的某个属性的样本值,服从正态分布](#3.1 第1层次:个体的某个属性的样本值,服从正态分布)

[3.2 第2层次:抽样的误差,服从正态分布](#3.2 第2层次:抽样的误差,服从正态分布)

[3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!](#3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!)

正态分布的本质就是概率

[4 正态分布的特点](#4 正态分布的特点)

[4.1 正态分布是客观的](#4.1 正态分布是客观的)

[4.2 万物不齐(从结果上看)](#4.2 万物不齐(从结果上看))

[4.3 公平只是过程上的公平,而不能保证结果上的公平](#4.3 公平只是过程上的公平,而不能保证结果上的公平)

[4.4 钟形曲线,无限延申和逼近](#4.4 钟形曲线,无限延申和逼近)

[4.5 中庸](#4.5 中庸)

[4.6 动态平衡](#4.6 动态平衡)

[4.7 规律是可用的,顺规律办事](#4.7 规律是可用的,顺规律办事)

[4.7.1 不同的规律](#4.7.1 不同的规律)

[4.7.2 使用规律](#4.7.2 使用规律)


正态分布,概率论都是一种世界观

1 从正态分布说起

1.1 正态分布的定义

正态分布(Normal distribution),又称为常态分布或高斯分布,通常记作。其中, 是正态分布的数学期望(均值), 是正态分布的方差。μ = 0,σ = 1的正态分布被称为标准正态分布 [1]。

1.2 正态分布的名字

  • 正态分布 :Normal distribution
  • 自然分布
  • 常态分布
  • 高斯分布

1.3 正态分布的广泛,和基础性

  • 正态分布,在自然界广泛存在
  • 无论是宏观的世界,还是很多微观的研究
  • 因此,正态分布也称为了大家心里对概率估计的一个基础。
  • 比如
  1. 我们假设一个我们不知道的事件:包含2个基本事件,我们默认为是1:1,也就是50%概率
  2. 我们对于一个我们不知道的随机变量 ,我们会默认这个随机变量是符合正态分布的规律的

2 正态分布的公式和图形

2.1 正态分布

2.2 标准正态分布

  • 期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。

3 正态分布的认识的3个层次

3.1 第1层次:个体的某个属性的样本值,服从正态分布

  • 比如某个属性,
  • 按照样本的数据,横轴全部展开,为数值/数值区间
  • 根据不同的数值/数值区间,统计其频度,作为Y坐标
  • 可以看到,这个属性的频度图,就符合正态分布的曲线形状

3.2 第2层次:抽样的误差,服从正态分布

  • 比如某个属性,每次抽样100个数据,统计每次抽样的平均值
  • 连续抽样50次,
  • 横轴是这50次的平均值
  • 纵轴是这些平均值的频度/出现次数
  • 也是符合正态分布的

3.3 第3层次:从标准正态分布去看,正态分布曲线就是概率曲线!

正态分布的本质就是概率

  • 标准正态分布曲线
  • 在 -1标准差,+1标准差内,发生的概率是68%
  • 在 -2标准差,+2标准差内,发生的概率是95%
  • 在 -3标准差,+3标准差内,发生的概率是99%

4 正态分布的特点

4.1 正态分布是客观的

  • 世界是客观的,是不以人们的意志想法为转移的
  • 大地与山川,喷泉也是一个钟形曲线
  • 世界观是多样的,且可能在不同的情境下有用,比如地心说在日常的小范围围观环境下很实用。但是研究宇宙得用日心说。但是正态分布是我们遇到很多随机的对象都符合的一种分布类型。

4.2 万物不齐(从结果上看)

  • 万物不齐
  • 万物应该是按正态分布/自然分布的居多,所以一定是钟形曲线,大地也是平地+山峦
  • 喷泉也是一个钟形曲线
  • 因为万物不齐,所以需要单独的去认识每个事物。
  • 反之,否则之需要单独认识1个事物就可以认识整体了,这对于现实认知,显然是荒谬的。
  • 庄子:理想? 希望万物齐一
  • 孟子:事实求是,认为万物不齐。
  • 万物不齐天地事,大道之行是中庸。

4.3 公平只是过程上的公平,而不能保证结果上的公平

  • 结果的正确/正义无法保证
  • 只能从过程的正确/正义上去保证
  • 反而从辩证的角度看,正是因为,过程是公平的随机,结果才是不公平的

4.4 钟形曲线,无限延申和逼近

  • 正态分布/自然分布也说了这个问题,一定是中间大,两头小。
  • 从标准正态分布曲线上看,而且钟形曲线是无限的,趋近两边的极限无限接近但是永远无限延申下去,理论上可以覆盖所有情况。但是概率确是无限小。
  • 中间的比例是最高的,这个是基于正态分布来说
  • 越到两边,占比越少,只至长尾

4.5 中庸

  • 中间的比例是最高的,这个是基于正态分布来说
  • 中间这个值,很可能就是均值,且因为占比高,更具有代表性,
  • 越道两边,占比越少,只至长尾
  • 同样的X轴宽度下/标准差长度下,中间的聚集目的更高,面积大/概率高。两边概率低。
  • 而且如果不引入其他变量,那么正态分布的均值,就是预测将来发生值最好的值!

4.6 动态平衡

  • 钟形曲线,从顶上到两边,都是曲线,是不稳定的,不是静态平衡,只能是动态平衡。
  • 逆水行舟,不进则退。

4.7 规律是可用的,顺规律办事

4.7.1 不同的规律

  • 天之道,损有余而补不足
  • 人之道,损不足而补有余
  • 这是两种规律,规律是相对客观的,不变的,需要遵循,且可以利用模仿的。
  • 人们自发的,都是按照人之道而行事的。
  • 而人们也可以行天道,按天道的规律做事。从而对抗人之道的规律和结果。

4.7.2 使用规律

  • 从使用规律上来说,人定胜天,是人可以利用规律,我是这么理解的
相关推荐
古希腊掌管学习的神40 分钟前
[机器学习]XGBoost(3)——确定树的结构
人工智能·机器学习
ZHOU_WUYI1 小时前
4.metagpt中的软件公司智能体 (ProjectManager 角色)
人工智能·metagpt
靴子学长2 小时前
基于字节大模型的论文翻译(含免费源码)
人工智能·深度学习·nlp
AI_NEW_COME3 小时前
知识库管理系统可扩展性深度测评
人工智能
海棠AI实验室3 小时前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习
hunteritself3 小时前
AI Weekly『12月16-22日』:OpenAI公布o3,谷歌发布首个推理模型,GitHub Copilot免费版上线!
人工智能·gpt·chatgpt·github·openai·copilot
IT古董4 小时前
【机器学习】机器学习的基本分类-强化学习-策略梯度(Policy Gradient,PG)
人工智能·机器学习·分类
centurysee4 小时前
【最佳实践】Anthropic:Agentic系统实践案例
人工智能
mahuifa4 小时前
混合开发环境---使用编程AI辅助开发Qt
人工智能·vscode·qt·qtcreator·编程ai
四口鲸鱼爱吃盐4 小时前
Pytorch | 从零构建GoogleNet对CIFAR10进行分类
人工智能·pytorch·分类