R数据科学 17.3.3答案

(1) 除了使用 lm() 函数拟合一条直线,你还可以使用 loess() 函数来拟合一条平滑曲线。使用 loess() 代替 lm() 对 sim1 数据集重复模型拟合、网格生成、预测和可视化的过程,并将结果与 geom_smooth() 函数进行比较。

复制代码
# 使用 loess() 拟合平滑曲线
loess_model <- loess(y ~ x, data = sim1)
# 生成网格数据
grid <- data.frame(x = seq(min(sim1$x), max(sim1$x), length.out = 100))
# 预测
grid$predicted_y <- predict(loess_model, newdata = grid)
# 可视化
library(ggplot2)
ggplot(sim1, aes(x, y)) +
  geom_point() +
  geom_line(data = grid, aes(x, predicted_y), color = "blue") +
  geom_smooth(method = "loess", se = FALSE, color = "red") # geom_smooth 对比

(2) add_predictions()函数还伴有 2 个函数:gather_predictions()和 spread_predicitons()。这 3 个函数有什么不同?

  1. add_predictions():将模型的预测值直接添加到原始数据框中,形成一个新的列,便于后续分析。

  2. gather_predictions():将预测结果转化为长格式(long format),通常适用于在 ggplot2 中进行分面(facet)或比较不同模型的情况。

  3. spread_predictions():将预测结果转化为宽格式(wide format),每个模型的预测值会形成一个新的列,这在比较多个模型的预测时非常有用。

(3) geom_ref_line() 函数的功能是什么?它来自于哪个 R 包?在显示残差的图形中显示一条参考线是非常重要和有用的,为什么这么说呢?

geom_ref_line() 用于在图形中添加参考线(例如,水平线或垂直线)。这个函数通常来自于 ggplot2 包。

在显示残差图时,添加参考线(如 y=0 的水平线)是非常重要和有用的,因为它能帮助我们直观地观察残差的分布。如果残差分布在这条参考线的上下是随机的,没有明显的模式,说明模型拟合良好;反之,如果残差呈现系统性的偏离,可能意味着模型存在问题或需要调整。

(4) 为什么需要检查残差绝对值的频率多边形图?与检查残差本身相比,这种方式有什么优缺点呢?

检查残差绝对值的频率多边形图可以帮助我们更好地理解残差的分布特性。优缺点如下:

  1. 优点

    频率多边形图可以直观显示残差绝对值的分布情况,尤其是它们的集中程度和分散程度。

    可以揭示潜在的异常值和偏差模式,帮助判断模型的拟合质量。

  2. 缺点

    仅仅查看残差绝对值可能会掩盖残差的实际值,导致对模型性能的误解。与检查残差的实际值相比,可能无法直观地发现模型的系统性错误或模式。

    总之,结合这两种方式,能够更全面地评估模型的拟合效果。

相关推荐
说私域1 小时前
基于开源AI智能名片链动2+1模式S2B2C商城小程序的超级文化符号构建路径研究
人工智能·小程序·开源
永洪科技1 小时前
永洪科技荣获商业智能品牌影响力奖,全力打造”AI+决策”引擎
大数据·人工智能·科技·数据分析·数据可视化·bi
shangyingying_11 小时前
关于小波降噪、小波增强、小波去雾的原理区分
人工智能·深度学习·计算机视觉
小赖同学啊2 小时前
物联网数据安全区块链服务
开发语言·python·区块链
码荼2 小时前
学习开发之hashmap
java·python·学习·哈希算法·个人开发·小白学开发·不花钱不花时间crud
书玮嘎2 小时前
【WIP】【VLA&VLM——InternVL系列】
人工智能·深度学习
猫头虎2 小时前
猫头虎 AI工具分享:一个网页抓取、结构化数据提取、网页爬取、浏览器自动化操作工具:Hyperbrowser MCP
运维·人工智能·gpt·开源·自动化·文心一言·ai编程
要努力啊啊啊3 小时前
YOLOv2 正负样本分配机制详解
人工智能·深度学习·yolo·计算机视觉·目标跟踪
CareyWYR3 小时前
大模型真的能做推荐系统吗?ARAG论文给了我一个颠覆性的答案
人工智能