决定差异最小的标准通常依赖于您的具体问题和任务。以下是一些常见的用于评估预测性能的标准和思路:
- **均方根误差 (RMSE):** RMSE 是预测值和真实值之间差异的平方的平均值的平方根。它对较大的误差更加敏感。
python
from sklearn.metrics import mean_squared_error
rmse = mean_squared_error(result_df['Real_Data'], result_df['Predicted_Data'], squared=False)
- **平均绝对误差 (MAE):** MAE 是预测值和真实值之间绝对差异的平均值。它对异常值不太敏感。
python
from sklearn.metrics import mean_absolute_error
mae = mean_absolute_error(result_df['Real_Data'], result_df['Predicted_Data'])
- **平均百分比误差 (MAPE):** MAPE 表示平均预测误差的百分比。它在百分比方面提供了直观的度量。
python
def mean_absolute_percentage_error(y_true, y_pred):
y_true, y_pred = np.array(y_true), np.array(y_pred)
return np.mean(np.abs((y_true - y_pred) / y_true)) * 100
mape = mean_absolute_percentage_error(result_df['Real_Data'], result_df['Predicted_Data'])
- **决定系数 (R-squared):** 决定系数表示模型能够解释目标变量方差的百分比。取值范围在0到1之间,越接近1表示模型拟合得越好。
python
from sklearn.metrics import r2_score
r_squared = r2_score(result_df['Real_Data'], result_df['Predicted_Data'])
您可以选择一个或多个这些指标,具体取决于您关心的方面。例如,如果您更关注异常值,可能更倾向于使用 MAE 或 MAPE;如果您关心整体趋势和波动,可能更倾向于使用 RMSE 或 R-squared。在选择标准时,最好根据您的问题领域和任务目标来权衡不同的性能指标。