测试一波回归模型的误差

如何衡量一个线性回归模型准确性

上一篇文章讲了怎么使用线性回归来预测,但是没有对这个模型的性能和准确性进行有效评估。

一般来讲,误差越小,预测就越准确。但是如果误差过于小,也要考虑是否过度拟合。

下面几个指标是用来衡量一个模型的误差大小:

    1. 平均绝对误差(Mean Absolute Error,简称MAE)
      它的数学公式是:

scikit-learn里对应的函数如下:

复制代码
mean_absolute_error(y_true, y_pred)

其中y_true是真实的目标值,y_pred是预测目标值。

MAE越小,说明模型的预测能力越好。

    1. 均方误差(Mean Squared Error,简称MSE)
      它的数学公式是:

mean_squared_error(y_true, y_pred)

MSE越小,表示模型的预测值与实际观测值之间的差异较小,即模型具有较高的预测精度。

    1. 均方对数误差(Mean Squared Log Error,简称MSLE):

mean_squared_log_error(y_true, y_pred)

MSLE的值越小,表示预测结果与真实值的差异越小,即模型的拟合程度越好。

    1. 绝对误差中值(Median Absolute Error,简称MedAE):

median_absolute_error(y_true, y_pred)

MedAE越小的模型,通常意味着它在大多数数据点上的预测更为准确。

实际使用中我用得最多的是MSE和MEdAE以及r2 score(它用来描述自变量和因变量的关联性,通常值为0-1之间),具体代码如下所示:

复制代码
import sklearn.metrics as metrics
import numpy as np

# Sample data
X = np.array([[1], [2], [3], [4], [5]])  # Input feature
y = np.array([2, 3.5, 2.8, 4.6, 5.2])     # Output target

# Create a linear regression model
model = LinearRegression()

# Fit the model to the data
model.fit(X, y)

# Make predictions
X_new = np.array([[6], [7]])  # New data for prediction
y_pred = model.predict(X_new)

print("Predictions:", y_pred)

mse = metrics.mean_squared_error(y, y_pred)
r2 = metrics.r2_score(y, y_pred)
m_error = metrics.median_absolute_error(y, y_pred)

print('MSE is {}'.format(mse))
print('R2 is {}'.format(r2))
print('M_ERROR is {}'.format(m_error))
相关推荐
老余捞鱼16 天前
线性回归实战:5步验证你的量化因子是否真有效
算法·金融·回归·线性回归·ai量化
2601_9618451517 天前
花生十三网课网盘|百度网盘|下载
数据结构·算法·链表·贪心算法·排序算法·线性回归·动态规划
金融小师妹17 天前
基于AI事件驱动模型与验证溢价框架的市场分析:从预期交易到事实验证,原油与黄金面临关键定价重构
大数据·人工智能·算法·均值算法·线性回归
安逸sgr17 天前
《图解机器学习-第六章》:线性回归和逻辑回归:最简单但最重要的机器学习模型
机器学习·逻辑回归·线性回归
2601_9618451517 天前
花生十三图推思维导图|图形推理|技巧
数据结构·算法·链表·贪心算法·排序算法·线性回归·动态规划
2601_9618752419 天前
法考资料2026|全套|资料已整理
数据结构·算法·链表·贪心算法·eclipse·线性回归·动态规划
金融小师妹22 天前
AI因子共振模型显示:金银比突破区间上沿,白银定价逻辑进入再校准阶段
人工智能·算法·均值算法·线性回归
chloe233324 天前
【动手学深度学习】笔记1:简单的线性回归
笔记·深度学习·线性回归
wayz1124 天前
Overlap:SLOPE(线性回归斜率)技术指标详解
算法·金融·数据分析·回归·线性回归·量化交易·特征工程
千寻girling25 天前
一周没跑步了 ,今日跑步 5KM , 哑铃+健身 20min , 俯卧撑 30 个 ;
数据结构·c++·python·算法·leetcode·职场和发展·线性回归