NumPy 正态分布与 Seaborn 可视化指南

正态分布(高斯分布)

简介

正态分布(也称为高斯分布)是一种非常重要的概率分布,它描述了许多自然和人为现象的数据分布情况。正态分布的形状呈钟形,其峰值位于平均值处,两侧对称下降。

特征

正态分布可以用两个参数来完全描述:

均值(μ):表示数据的平均值,分布的峰值位于 μ 处。

标准差(σ):表示数据的离散程度,数值越大,分布越平坦。

生成正态分布数据

NumPy 提供了 random.normal() 函数来生成服从正态分布的随机数。该函数接受以下参数:

loc:正态分布的均值,默认为 0。
scale:正态分布的标准差,默认为 1。
size:输出数组的形状。

示例:生成 100 个服从正态分布的随机数,均值为 5,标准差为 2:

python 复制代码
import numpy as np

data = np.random.normal(loc=5, scale=2, size=100)
print(data)

可视化正态分布

Seaborn 库提供了便捷的函数来可视化分布,包括正态分布。

示例:绘制服从正态分布的数据的分布图:

python 复制代码
import seaborn as sns
import numpy as np

data = np.random.normal(size=1000)

sns.distplot(data)
plt.show()

应用

正态分布在许多领域都有应用,例如:

统计学:用于推断总体参数,进行假设检验等。

机器学习:用于数据预处理,特征工程等。

金融:用于建模股票价格、汇率等金融数据。

工程:用于控制质量、可靠性分析等。

练习

  1. 生成 500 个服从正态分布的随机数,均值为 10,标准差为 3,并绘制它们的分布图。
  2. 比较不同标准差下正态分布形状的变化。
  3. 利用正态分布来模拟一次考试成绩,并计算平均分和标准分。

解决方案

python 复制代码
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt

# 1. 生成服从正态分布的随机数并绘制分布图
data = np.random.normal(loc=10, scale=3, size=500)
sns.distplot(data)
plt.show()

# 2. 比较不同标准差下正态分布形状的变化
sns.distplot(np.random.normal(size=1000, scale=1), label="σ=1")
sns.distplot(np.random.normal(size=1000, scale=2), label="σ=2")
sns.distplot(np.random.normal(size=1000, scale=3), label="σ=3")
plt.legend()
plt.show()

# 3. 模拟考试成绩并计算平均分和标准分
scores = np.random.normal(loc=80, scale=10, size=100)
print("平均分:", scores.mean())
print("标准分:", (scores - scores.mean()) / scores.std())

解释:

在第一个练习中,我们生成了 500 个服从正态分布的随机数,均值为 10,标准差为 3,并使用 Seaborn 的 distplot() 函数绘制了它们的分布图。

在第二个练习中,我们生成了三个服从正态分布的数据集,分别设置标准差为 1、2 和 3,并使用 Seaborn 的 distplot() 函数绘制了它们的分布图。我们可以观察到,随着标准差的增加,分布变得更加平坦,两侧的尾巴更加明显。

在第三个练习中,我们模拟了一次考试成绩,假设成绩服从正态分布,均值为 80,标准差为 10。然后,我们计算了考试成绩的平均分和标准分。

最后

为了方便其他设备和平台的小伙伴观看往期文章:

微信公众号搜索:Let us Coding,关注后即可获取最新文章推送

看完如果觉得有帮助,欢迎点赞、收藏、关注

相关推荐
知其然亦知其所以然29 分钟前
深入Kafka:如何保证数据一致性与可靠性?
后端·面试·kafka
安若ly32 分钟前
VDS虚拟导播切换台软件
经验分享·视觉检测·软件工程·软件需求
IT·陈寒38 分钟前
Kotlin vs Java:深入解析两者之间的最新差异与优劣(全面指南)
java·python·kotlin
月清晖1 小时前
centos更换yum源、安装Docker和换源
linux·docker·centos
测试萧十一郎1 小时前
推荐三款常用接口测试工具!
自动化测试·软件测试·功能测试·测试工具·程序人生·职场和发展
知识分享小能手1 小时前
从新手到高手:Scala函数式编程完全指南,Scala 访问修饰符(6)
大数据·开发语言·后端·python·数据分析·scala·函数式编程
elderingezez1 小时前
2024年用scrapy爬取BOSS直聘的操作
爬虫·python·scrapy
【 教主 】1 小时前
<Linux> 多线程
linux·运维·服务器
Eiceblue1 小时前
用Python轻松转换Markdown文件为PDF文档
开发语言·vscode·python·pdf·word
杰哥在此1 小时前
Java面试题:解释跨站脚本攻击(XSS)的原理,并讨论如何防范
java·开发语言·面试·编程·xss