Python编程读取csv文件数据分别计算RMSE、SD、R

使用 Pandas 和 NumPy 库,从 CSV 文件中读取数据,并对列名进行了更新。使用循环计算了三组数据的 RMSE、标准差和相关系数,并将结果打印输出。其中,RMSE(Root Mean Squared Error)是衡量预测值和真实值之间误差的一种方法;SD(Standard Deviation)是预测值和真实值之间误差的标准差;R(Correlation Coefficient)是衡量预测值和真实值之间线性关系的一种方法。通过计算这些指标,可以评估模型的性能和预测精度。

一、获得CSV文件中的列名

python 复制代码
import pandas as pd
import numpy as np

# 读取 csv 文件
data = pd.read_csv('组合处理1.csv')
# 输出列名
print(data.columns)
# 更新列名
c 复制代码
结果:
['true value', 'predicted value', 'Unnamed: 2', 'true value.1',
'predicted value.1', 'Unnamed: 5', 'true value.2', 'predicted value.2']

二、完整代码计算

python 复制代码
import pandas as pd
import numpy as np

# 读取 csv 文件
data = pd.read_csv('组合处理1.csv')
# 输出列名
print(data.columns)
# 更新列名
data.columns = ['true value', 'predicted value', 'Unnamed: 2', 'true value.1',
                'predicted value.1', 'Unnamed: 5', 'true value.2', 'predicted value.2']

# 分别计算三对数据
for i, (true_col, pred_col) in enumerate([('true value', 'predicted value'),
                                          ('true value.1', 'predicted value.1'),
                                          ('true value.2', 'predicted value.2')]):
    # 提取需要计算的列
    true_values = data[true_col]
    predicted_values = data[pred_col]

    # 计算RMSE
    rmse = np.sqrt(((predicted_values - true_values) ** 2).mean())

    # 计算标准差
    sd = np.std(predicted_values - true_values)

    # 计算相关系数
    r = np.corrcoef(true_values, predicted_values)[0, 1]

    print(f"第{i+1}组结果:")
    print(f"RMSE: {rmse:.4f}")
    print(f"SD: {sd:.4f}")
    print(f"R: {r:.4f}")
相关推荐
量化君也14 分钟前
从回测到全自动实盘交易,全天候策略需要经历哪些改造?
大数据·人工智能·python·算法·金融
装不满的克莱因瓶20 分钟前
自然语言处理发展历史——从规则系统到大语言模型的演进之路
网络·人工智能·python·深度学习·语言模型·自然语言处理
2601_9516457830 分钟前
Linux 编程语言全解析:C、C++、Python、Go、Rust 谁更强?
linux·python·go·c·编程语言
themingyi31 分钟前
Abaqus2024安装python包pandas
开发语言·python·pandas
殇淋狱陌40 分钟前
Python列表知识思维导图
开发语言·python·学习
Web极客码1 小时前
如何通过 Python + LLM 用最少的 Token 完成精准推荐任务
开发语言·人工智能·python·ai
一晌小贪欢1 小时前
第26节:自动化办公——利用 Python 自动生成动态分析报告 (PPT/PDF)
开发语言·python·数据分析·自动化·powerpoint·pandas·数据可视化
西西弗Sisyphus1 小时前
YOLO26 自定义损失函数 重写 init_criterion 方法 损失类不继承基类
pytorch·python·yolo·yolo11·yolo26
装不满的克莱因瓶2 小时前
RLHF中的PPO算法——大语言模型对齐优化的核心引擎
人工智能·python·深度学习·算法·机器学习·语言模型·自然语言处理
c_lb72882 小时前
期货主连研究具体月实盘:KQ 连续与标的月份偏差怎么记
python·区块链