Python求均值,方差,标准差

参考链接:变异系数(Coefficient of Variation,COV)和协方差(Covariance, Cov)-CSDN博客

参考链接:pandas中std和numpy的np.std区别_numpy pandas std-CSDN博客


在计算蛋白质谱数据中的每个蛋白对应的**变异系数(Coefficient of Variation, CV)**时发现,使用numpy 里的 .std() 和 pandas 里的 .std()计算得到的标准差值有差异,于是我就想一探究竟,不查不知道,一查吓一跳,又学到了!

原因在于默认情况下

numpy计算的为总体标准差,ddof=0;一般在拥有所有数据的情况下,计算所有数据的标准差时用,即最终除以n,而非n-1;

pandas计算的为样本标准偏差,ddof=1;一般在只有部分数据,但需要求总体标准差时用,当只有部分数据时,根据统计规律,除以n时计算的标准差往往偏小,因此需要除以n-1,即n-ddof;

numpy 的 .std() 和 pandas 的 .std() 函数之间是不同的

  • numpy 计算的是总体标准差,参数ddof = 0
  • pandas 计算的是样本标准差,参数ddof = 1
    CV又称"离散系数",是概率分布离散程度的一个归一化量度,其定义为标准差 与平均值 之比:

变异系数的优点:

(1)消除单位的影响

(2)消除均值大小不同的影响

我们首先来看一下在统计学中怎么对总体标准差和样本标准差公式进行定义的:

  • 如果是总体,标准差公式根号内除以N
  • 如果是样本,标准差公式根号内除以(N-1)

我们一般用Numpy来求均值、方差、标准差

python 复制代码
import numpy as np 
 
my_list = [1,2,3,4,5,6]

# 求均值
my_mean = np.mean(my_list)

# 求方差
my_var = np.var(my_list)

# 求标准差
my_std = np.std(my_list, ddof=1)
速度区别

速度由快到慢依次:

python 复制代码
my_arr = pd.Series([1,2,3,4,5,6])

# 速度由快至慢
np.std(my_arr.values) > my_arr.std(ddof=0) > np.std(my_arr)
相关推荐
CappuccinoRose14 分钟前
回溯法 - 软考备战(四十三)
算法·排列组合·路径·n皇后·子集·解数独·岛屿
AC赳赳老秦17 分钟前
OpenClaw进阶技巧:批量修改文件内容、替换关键词,解放双手
java·linux·人工智能·python·算法·测试用例·openclaw
Robot_Nav1 小时前
Shape-Aware MPPI(SA MPPI)算法:基于RC-ESDF的任意形状机器人实时轨迹优化
算法·机器人·sa-mppi
小O的算法实验室2 小时前
2026年ESWA,自适应基于排序的协同进化学习粒子群算法+边缘计算服务器部署,深度解析+性能实测
算法·论文复现·智能算法·智能算法改进
cpp_25012 小时前
P1832 A+B Problem(再升级)
数据结构·c++·算法·动态规划·题解·洛谷·背包dp
꧁细听勿语情꧂2 小时前
合并两个有序表、判断链表的回文结构、相交链表、环的链表一和二
c语言·开发语言·数据结构·算法
木井巳3 小时前
【递归算法】解数独
java·算法·leetcode·决策树·深度优先·剪枝
大肥羊学校懒羊羊3 小时前
完数与盈数的计算题解
数据结构·c++·算法
阿Y加油吧3 小时前
算法实战笔记:LeetCode 31 下一个排列 & 287 寻找重复数
笔记·算法·leetcode
穿条秋裤到处跑3 小时前
每日一道leetcode(2026.04.24):距离原点最远的点
算法·leetcode·职场和发展