一、
a.
R
# 给定的 (x, y) 数据
x <- c(2, 9, 10, 7)
y <- c(3, 13, 12, 11)
# 线性回归模型 y = a + bx
model1 <- lm(y ~ x)
summary(model1) # 查看回归结果
# 提取系数 a 和 b
a <- coef(model1)[1]
b <- coef(model1)[2]
# 预测值
y_pred <- predict(model1)
# 计算 RMSE
rmse <- sqrt(mean((y - y_pred)^2))
cat("RMSE for model 1:", rmse, "\n")
# 计算 R²
r_squared <- summary(model1)$r.squared
cat("R² for model 1:", r_squared, "\n")
b.
R
# b
# 给定的 (x, y) 数据
x <- c(2, 9, 10, 7)
y <- c(3, 13, 12, 11)
# 定义 z = log(x)
z <- log(x)
# 拟合 z 的线性回归模型
model_log <- lm(y ~ z)
# 打印模型参数 a 和 b
summary(model_log)
# 计算预测值
y_pred_log <- predict(model_log)
# 计算 RMSE
rmse_log <- sqrt(mean((y - y_pred_log)^2))
cat("RMSE (log):", rmse_log, "\n")
# 计算 R^2
r_squared_log <- summary(model_log)$r.squared
cat("R-squared (log):", r_squared_log, "\n")
c.
二、
a.
题目给出了三组数据点 (x_{11}, x_{12}, y_1), (x_{21}, x_{22}, y_2), (x_{31}, x_{32}, y_3):
• (x_{11}, x_{12}, y_1) = (0, 1, 1)
• (x_{21}, x_{22}, y_2) = (3, -2, 9)
• (x_{31}, x_{32}, y_3) = (-1, 4, -2)
问题 a 要求估计多元线性回归模型的 R^2 ,但是不需要进行计算。
R^2 是决定系数,表示模型解释的方差比例。 R^2 = 1 表示模型完美拟合数据,而 R^2 = 0 表示模型无法解释任何方差。
因为只有 3 个数据点,而我们有两个自变量 x_1 和 x_2 ,意味着回归模型将完美拟合这些数据点。因此,在这种情况下,模型的 R^2 值将是 1,因为我们可以通过回归完全解释数据的变化。
b.
R
# 构造 X 矩阵和 y 向量
X <- matrix(c(1, 1, 1, 1, # 截距项
0, 3, -1, 2, # x1
1, -2, 4, 2), # x2
nrow=4, byrow=TRUE)
y <- c(1, 9, -2, 2)
# 计算回归系数
beta <- solve(t(X) %*% X) %*% t(X) %*% y
beta