【Pandas】pandas Series var

Pandas2.2 Series

Computations descriptive stats

方法 描述
Series.abs() 用于计算 Series 中每个元素的绝对值
Series.all() 用于检查 Series 中的所有元素是否都为 True 或非零值(对于数值型数据)
Series.any() 用于检查 Series 中是否至少有一个元素为 True 或非零值(对于数值型数据)
Series.autocorr() 用于计算 Series 的自相关系数
Series.between() 用于检查 Series 中的每个元素是否在指定的两个值之间(包括边界值)
Series.clip() 用于将 Series 中的元素限制在指定的上下限之间
Series.corr() 用于计算两个 Series 之间的相关系数
Series.count() 用于计算 Series 中非 NA/null 值的数量
Series.cov(other[, min_periods, ddof]) 用于计算两个 Series 之间的协方差
Series.cummax([axis, skipna]) 用于计算 Series 中元素的累积最大值
Series.cummin([axis, skipna]) 用于计算 Series 中元素的累积最小值
Series.cumprod([axis, skipna]) 用于计算 Series 中元素的累积乘积
Series.cumsum([axis, skipna]) 用于计算 Series 中元素的累积和
Series.describe([percentiles, include, exclude]) 用于生成 Series 对象的描述性统计信息的方法
Series.diff([periods]) 用于计算 Series 中元素与前一个元素之间差值的方法
Series.factorize([sort, use_na_sentinel]) 用于将 Series 中的唯一值编码为从 0 开始的整数索引的方法
Series.kurt([axis, skipna, numeric_only]) 用于计算 Series 中数据的峰度(kurtosis)
Series.max([axis, skipna, numeric_only]) 用于计算 Series 中所有元素的最大值
Series.mean([axis, skipna, numeric_only]) 用于计算 Series 中所有元素的算术平均值
Series.median([axis, skipna, numeric_only]) 用于计算 Series 对象中位数的函数
Series.min([axis, skipna, numeric_only]) 用于计算 Series 对象最小值的函数
Series.mode([dropna]) 用于计算 Series 对象中最常出现的值(众数)的函数
Series.nlargest([n, keep]) 用于获取 Series 对象中最大的 n 个值的函数
Series.nsmallest([n, keep]) 用于获取 Series 对象中最小的 n 个值的函数
Series.pct_change([periods, fill_method, ...]) 用于计算 Series 对象中元素与前一个元素之间百分比变化的方法
Series.prod([axis, skipna, numeric_only, ...]) 用于计算 Series 对象中所有元素乘积的函数
Series.quantile([q, interpolation]) 用于计算 Series 对象的分位数(quantiles)的方法
Series.rank([axis, method, numeric_only, ...]) 用于计算 Series 对象中每个元素的排名的方法
Series.sem([axis, skipna, ddof, numeric_only]) 用于计算 Series 对象的标准误差(Standard Error of the Mean, SEM)的方法
Series.skew([axis, skipna, numeric_only]) 用于计算 Series 对象的偏度(skewness)的方法
Series.std([axis, skipna, ddof, numeric_only]) 用于计算 Series 对象的标准差(Standard Deviation, STD)的方法
Series.sum([axis, skipna, numeric_only, ...]) 用于计算 Series 中元素的总和
Series.var([axis, skipna, ddof, numeric_only]) 用于计算 Series 中元素的样本方差

pandas.Series.var

pandas.Series.var() 方法用于计算 Series 中元素的样本方差。以下是该方法的详细描述:

  • 参数

    • axis:{index (0)},默认为0。此参数在 Series 中通常不使用,因为 Series 是一维数据结构。
    • skipna:布尔值,默认为 True。如果设置为 True,则在计算时忽略 NaN 值;如果设置为 False,则 NaN 值会导致结果也为 NaN。
    • ddof:整数,默认为 1。表示"Delta Degrees of Freedom"(自由度调整)。方差计算公式中的分母是 N - ddof,其中 N 是观测值的数量。默认情况下,ddof=1 计算的是无偏样本方差。
    • numeric_only:布尔值,默认为 None。如果设置为 True,则只包含数值列(float、int、boolean)。此参数在 Series 中通常不使用,因为 Series 只有一种数据类型。
  • 返回值

    • 返回一个标量值,表示 Series 中所有元素的样本方差。
示例及结果
python 复制代码
import pandas as pd

# 创建一个简单的 Series
s = pd.Series([1, 2, 3, 4, 5])

# 计算 Series 的样本方差,默认 ddof=1
result_default_ddof = s.var()
print("Variance with default ddof (1):", result_default_ddof)

# 设置 ddof=0 计算总体方差
result_ddof_0 = s.var(ddof=0)
print("Variance with ddof=0:", result_ddof_0)

# 包含 NaN 值的 Series
s_with_nan = pd.Series([1, 2, 3, None, 5])

# 忽略 NaN 值计算方差
result_skipna_true = s_with_nan.var(skipna=True)
print("Variance with skipna=True:", result_skipna_true)

# 不忽略 NaN 值计算方差
result_skipna_false = s_with_nan.var(skipna=False)
print("Variance with skipna=False:", result_skipna_false)
输出结果
复制代码
Variance with default ddof (1): 2.5
Variance with ddof=0: 2.0
Variance with skipna=True: 2.9166666666666665
Variance with skipna=False: nan
解释
  • 对于没有 NaN 值的 Series:

    • 默认情况下 (ddof=1),计算的是无偏样本方差。
    • 如果将 ddof 设置为 0,则计算的是总体方差。
  • 当 Series 中包含 NaN 值时:

    • 如果 skipna=True,则忽略 NaN 值并计算剩余元素的方差。
    • 如果 skipna=False,则只要存在 NaN 值,结果就会是 NaN。
相关推荐
TDengine (老段)20 分钟前
TDengine 使用最佳实践
java·大数据·数据库·物联网·时序数据库·iot·tdengine
怦然心动~34 分钟前
springboot 3 集成Redisson
java·spring boot·redisson
Firmin1234561 小时前
使用Flask和OpenCV 实现树莓派与客户端的视频流传输与显示
python·opencv·flask
rockmelodies1 小时前
基于Python的端口扫描器和目录扫描工具实现方案,结合机器学习进行指纹识别
人工智能·python·机器学习
小Mie不吃饭1 小时前
Maven | 站在初学者的角度配置
java·spring boot·maven
林犀居士1 小时前
JVM系统变量的妙用
java·jvm系统变量
是十一月末1 小时前
Opencv之掩码实现图片抠图
人工智能·python·opencv·计算机视觉·图片识别
阿_星_1 小时前
解决pip install 出现error: subprocess-exited-with-error的问题
开发语言·python·pip
Hum8le1 小时前
CTF题目《SSRFMe》(网鼎杯 2020 玄武组)WriteUp
redis·python·安全·web安全·php
Dontla2 小时前
uv命令介绍(高性能Python包管理工具,旨在替代pip、pip-tools和virtualenv等传统工具)
python·pip·uv