Python计算多个表格中多列数据的平均值与标准差并导出为新的Excel文件

本文介绍基于Python 语言,对一个或多个表格文件多列数据 分别计算平均值标准差 ,随后将多列数据 对应的这2个数据结果导出为新的表格文件的方法。

首先,来看一下本文的需求。现有2.csv格式的表格文件,其每1列表示1个变量,每1行则表示1个样本;其中1个表格文件如下图所示。

我们现在需要分别对这2个表格文件执行如下操作:计算出其中部分变量 (部分列)在所有样本 (所有行)中的平均值标准差 数据,然后将这些数据结果导出到一个新的.csv格式文件中。

需求也很简单。明确了需求,接下来就可以开始代码的撰写;本文所用代码如下。

python 复制代码
# -*- coding: utf-8 -*-
"""
Created on Sun Mar 10 17:59:23 2024

@author: fkxxgis
"""

import pandas as pd

data = pd.read_csv(r"F:\Data_Reflectance_Rec\Train_data\Train_Model_0715_Main_Over_B_New.csv")
data_nir = pd.read_csv(r"F:\Data_Reflectance_Rec\Train_data\Train_Model_0715_Main_Over_NIR_New.csv")

column_need = ["blue", "green", "red", "inf", "NDVI", "NDVI_dif", "days", "sola", "temp", "prec", "soil", "blue_h", "green_h", "red_h", "inf_h", "ndvi_h", "blue_h_dif", "green_h_dif", "red_h_dif", "inf_h_dif", "ndvi_h_dif"]

mean_value = data[column_need].mean()
std_value = data[column_need].std()
mean_value_nir = data_nir[column_need].mean()
std_value_nir = data_nir[column_need].std()

data_new = pd.DataFrame({"mean_RGB": mean_value, "std_RGB": std_value, "mean_NIR": mean_value_nir, "std_NIR": std_value_nir})

data_new.to_csv(r"F:\Data_Reflectance_Rec\Train_data\mean_std.csv", index = True)

上述代码具体含义如下。

首先,使用pandas库导入了pd模块。

其次,使用pd.read_csv()函数从2.csv格式表格文件中读取数据。其中,因为本文需要读取的是2个文件,所以分别用data变量与data_nir变量读取这2个不同路径的表格文件。

接下来,定义了一个column_need列表,其中包含了需要计算平均值和标准差的列名。

随后,使用mean()函数和std()函数分别计算了datadata_nir中指定列的平均值和标准差,并将结果分别赋值给mean_valuestd_valuemean_value_nirstd_value_nir变量。

然后,使用pd.DataFrame创建了一个新的数据框data_new,其中包含了4列数据:mean_RGB列存储了data中计算得到的平均值std_RGB列存储了data中计算得到的的标准差mean_NIR列存储了data_nir中计算得到的平均值std_NIR列存储了data_nir中计算得到的标准差

最后,使用to_csv()函数将data_new保存到文件路径为mean_std.csv.csv格式文件中,设置index=True表示将索引列也保存到文件中。

运行上述代码,即可在结果文件夹中找到对应的结果.csv格式文件;如下图所示,其已经是我们需要的形式了------每1列表示1种对应的结果,每1行表示1种变量。

至此,大功告成。

欢迎关注:疯狂学习GIS

相关推荐
我的xiaodoujiao24 分钟前
从 0 到 1 搭建 Python 语言 Web UI自动化测试学习系列 9--基础知识 5--常用函数 3
前端·python·测试工具·ui
B站计算机毕业设计之家4 小时前
智慧交通项目:Python+PySide6 车辆检测系统 YOLOv8+OpenCV 自定义视频 自定义检测区域 (源码+文档)✅
大数据·python·opencv·yolo·智慧交通·交通·车流量
java1234_小锋5 小时前
TensorFlow2 Python深度学习 - 深度学习概述
python·深度学习·tensorflow·tensorflow2·python深度学习
迈火6 小时前
PuLID_ComfyUI:ComfyUI中的图像生成强化插件
开发语言·人工智能·python·深度学习·计算机视觉·stable diffusion·语音识别
浔川python社8 小时前
《网络爬虫技术规范与应用指南系列》(xc—5)完
爬虫·python
MongoVIP9 小时前
Scrapy爬虫实战:正则高效解析豆瓣电影
python·scrapy
李小白669 小时前
Python文件操作
开发语言·python
weixin_5259363310 小时前
金融大数据处理与分析
hadoop·python·hdfs·金融·数据分析·spark·matplotlib
Zwb29979210 小时前
Day 30 - 错误、异常与 JSON 数据 - Python学习笔记
笔记·python·学习·json
码界筑梦坊11 小时前
206-基于深度学习的胸部CT肺癌诊断项目的设计与实现
人工智能·python·深度学习·flask·毕业设计