R数据科学1.7练习题

(1) stat_summary() 函数的默认几何对象是什么?不使用统计变换函数的话,如何使用几何对象函数重新生成以上的图?

stat_summary() 的默认几何对象是 geom_pointrange(),即点、线范围图,它会在给定位置绘制点和误差线。

(2) geom_col() 函数的功能是什么?它和 geom_bar() 函数有何不同?

  1. geom_col():

    geom_col() 直接使用数据中的 y 值来生成柱形图。这意味着你需要明确提供 x 和 y 的数据值。
    功能:它按照你提供的 y 值来绘制柱状图。

  2. geom_bar():

    geom_bar() 则不需要提供 y 值,默认情况下它会统计数据的频次或计数并生成柱形图。它的 y 轴值默认使用计数(count)或指定统计变换(如比例 ...prop...)。

  3. 区别:
    geom_col() :直接使用给定的 y 值。
    geom_bar():计算 y 值为分类的计数或比例。

(3) 多数几何对象和统计变换都是成对出现的,总是配合使用。仔细阅读文档,列出所有成对的几何对象和统计变换。它们有什么共同之处?

  1. geom_bar() 和 stat_count():绘制柱状图,默认统计分类频数。
  2. geom_smooth() 和 stat_smooth():绘制平滑趋势线,默认计算线性模型或局部回归。
  3. geom_point() 和 stat_identity():绘制散点图,直接使用原始数据,不进行额外统计变换。
  4. geom_histogram() 和 stat_bin():绘制直方图,默认统计数据的分布频次。
  5. geom_boxplot() 和 stat_boxplot():绘制箱线图,统计五数摘要(最小值、下四分位数、中位数、上四分位数、最大值)。
    共同之处:几何对象用于定义图形外观,而统计变换则决定如何从数据生成几何对象所需的统计值。例如,geom_bar() 绘制柱状图,stat_count() 提供所需的计数统计;geom_smooth() 生成平滑曲线,stat_smooth() 计算拟合的回归模型。

(4) stat_smooth() 函数会计算出什么变量?哪些参数可以控制它的行为?

stat_smooth() 主要计算以下变量:

  1. y:平滑曲线的拟合值。
  2. ymin 和 ymax:置信区间的上下边界(如果 se = TRUE)。、

可控制 stat_smooth() 行为的参数:

  1. method:指定平滑方法,例如 lm(线性回归)或 loess(局部加权回归)。
  2. se:是否显示95%的置信区间,默认为 TRUE。
  3. span:用于 loess 回归时,控制平滑程度的参数,值越小,曲线越贴合数据。
  4. formula:指定回归模型的公式,例如 y ~ x。

(5) 在比例条形图中,我们需要设定 group = 1,这是为什么呢?换句话说,以下两张图会有什么问题?

ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut, y = ..prop..))
ggplot(data = diamonds) +
geom_bar(
mapping = aes(x = cut, fill = color, y = ..prop..)
)

在比例条形图中,设定 group = 1 是为了确保 y = ...prop... 计算的是总体比例,而不是分组比例。如果不设定 group = 1,则 ...prop... 会根据默认的分组(即 fill 的分组变量)来计算比例,这会导致错误的图形显示。

相关推荐
数据小爬虫@2 小时前
深入解析:使用 Python 爬虫获取苏宁商品详情
开发语言·爬虫·python
健胃消食片片片片2 小时前
Python爬虫技术:高效数据收集与深度挖掘
开发语言·爬虫·python
王老师青少年编程3 小时前
gesp(C++五级)(14)洛谷:B4071:[GESP202412 五级] 武器强化
开发语言·c++·算法·gesp·csp·信奥赛
一只小bit4 小时前
C++之初识模版
开发语言·c++
王磊鑫4 小时前
C语言小项目——通讯录
c语言·开发语言
钢铁男儿4 小时前
C# 委托和事件(事件)
开发语言·c#
Ai 编码助手5 小时前
在 Go 语言中如何高效地处理集合
开发语言·后端·golang
喜-喜5 小时前
C# HTTP/HTTPS 请求测试小工具
开发语言·http·c#
ℳ₯㎕ddzོꦿ࿐5 小时前
解决Python 在 Flask 开发模式下定时任务启动两次的问题
开发语言·python·flask
一水鉴天5 小时前
为AI聊天工具添加一个知识系统 之63 详细设计 之4:AI操作系统 之2 智能合约
开发语言·人工智能·python