Python编程读取csv文件数据分别计算RMSE、SD、R

使用 Pandas 和 NumPy 库,从 CSV 文件中读取数据,并对列名进行了更新。使用循环计算了三组数据的 RMSE、标准差和相关系数,并将结果打印输出。其中,RMSE(Root Mean Squared Error)是衡量预测值和真实值之间误差的一种方法;SD(Standard Deviation)是预测值和真实值之间误差的标准差;R(Correlation Coefficient)是衡量预测值和真实值之间线性关系的一种方法。通过计算这些指标,可以评估模型的性能和预测精度。

一、获得CSV文件中的列名

python 复制代码
import pandas as pd
import numpy as np

# 读取 csv 文件
data = pd.read_csv('组合处理1.csv')
# 输出列名
print(data.columns)
# 更新列名
c 复制代码
结果:
['true value', 'predicted value', 'Unnamed: 2', 'true value.1',
'predicted value.1', 'Unnamed: 5', 'true value.2', 'predicted value.2']

二、完整代码计算

python 复制代码
import pandas as pd
import numpy as np

# 读取 csv 文件
data = pd.read_csv('组合处理1.csv')
# 输出列名
print(data.columns)
# 更新列名
data.columns = ['true value', 'predicted value', 'Unnamed: 2', 'true value.1',
                'predicted value.1', 'Unnamed: 5', 'true value.2', 'predicted value.2']

# 分别计算三对数据
for i, (true_col, pred_col) in enumerate([('true value', 'predicted value'),
                                          ('true value.1', 'predicted value.1'),
                                          ('true value.2', 'predicted value.2')]):
    # 提取需要计算的列
    true_values = data[true_col]
    predicted_values = data[pred_col]

    # 计算RMSE
    rmse = np.sqrt(((predicted_values - true_values) ** 2).mean())

    # 计算标准差
    sd = np.std(predicted_values - true_values)

    # 计算相关系数
    r = np.corrcoef(true_values, predicted_values)[0, 1]

    print(f"第{i+1}组结果:")
    print(f"RMSE: {rmse:.4f}")
    print(f"SD: {sd:.4f}")
    print(f"R: {r:.4f}")
相关推荐
荷蒲几秒前
【小白量化智能体】应用5:编写通达信股票交易指标及生成QMT自动交易Python策略程序
开发语言·python
大模型真好玩9 分钟前
深入浅出LangChain AI Agent智能体开发教程(一)—认识LangChain&LangGraph
人工智能·python·mcp
医工交叉实验工坊27 分钟前
R 语言绘制 10 种精美火山图:转录组差异基因可视化
python·信息可视化·r语言
今天炼丹了吗2 小时前
RTDETR融合[WACV 2025]SEM-Net中的模块
python·深度学习·机器学习
这里有鱼汤2 小时前
一篇文章让你彻底搞懂量化中RSI指标,附实战策略+附源码,建议收藏
python
IIIIIII_II3 小时前
【视频格式转换】.264格式转为mp4格式
python·视频·格式转换
都叫我大帅哥3 小时前
LangChain的TXT文档加载:从入门到实战的终极指南
python·langchain
蹦蹦跳跳真可爱5893 小时前
Python----NLP自然语言处理(中文分词器--jieba分词器)
开发语言·人工智能·python·自然语言处理·中文分词
蹦蹦跳跳真可爱5893 小时前
Python----OpenCV(图像分割——彩色图像分割,GrabCut算法分割图像)
开发语言·图像处理·人工智能·python·opencv·计算机视觉
吃手机用谁付的款3 小时前
基于hadoop的竞赛网站日志数据分析与可视化(下)
大数据·hadoop·python·信息可视化·数据分析