R数据科学练习题部分解答,持续更新

本文章作为《R数据科学》书籍练习题解答合集使用。

推荐搭配Ctrl + F搜索使用。

1.5

  1. 对于每个存在的值,都会在行或者列上新建一行或者列分面图。

  2. 表示没有该(drv',cyl')的点的数据;

    后者点与前者对应的分面图构成一一映射关系。

  3. 两者都是绘制以displ作为x轴,hwy作为y轴的分面图。前者以drv作为横向分面依据,垂直分面省略;后者以cyl作为垂直分面依据,横向分面省略。

  4. 优势:更清晰地看出不同分面依据下x~y的分布;劣势:在分面依据离散数据较多时,可能出现较多分面图。

    可以根据分面依据的离散后数据量规模大小进行取舍。

    附图形属性下绘制点状图:

R 复制代码
ggplot(mpg)+
    geom_point(mapping = aes(displ , hwy , color = class))
  1. 输出框宽度一定前提下,拖动竖状滚动条阅读数据远比横向滚动条直观方便得多。

3.5.2

  1. 前者代表起飞时间,后者代表预计起飞时间,除以60即可:
R 复制代码
(NEW <- transmute(flights , dep_time = dep_time %/% 60 , sched_dep_time = sched_dep_time %/% 60))
  1. 按循环节一一对应将前者加到后者上去,正确用法例如:
R 复制代码
> 1:2 + 1:10
#> [1]  2  4  4  6  6  8  8 10 10 12

题目报错是因为10不是3的整数倍。

5.3.4

  1. 长宽高:xyz,单位为毫米.

  2. 使用下列代码可以直观发现异常:

R 复制代码
ggplot(diamonds) +
  geom_histogram(aes(x = price) , binwidth = 20)+
  coord_cartesian(xlim = c(0 , 3000))

注意到缺少270以前以及1500左右的数据.

  1. 使用下列代码可以直观看出数量多少:
R 复制代码
diamonds %>% 
  filter(carat >= 0.99 & carat <= 1) %>%
  group_by(carat) %>%
  summarize(n = n())
# A tibble: 2 × 2
#  carat     n
#  <dbl> <int>
#1  0.99    23
#2  1     1558
  1. coord_cartesina()不会丢弃溢出数据,而xlim()/ylim()会将溢出数据更改为NA再进行绘制。
    表现在绘图上,coord_cartesina()在范围边界是填充的,而后者由于绘制图像边界并非与设定范围重合,因此会产生一定空隙.
    放大到只显示一半的条形时,前者会照常绘制,而后者会将其弃置:
R 复制代码
ggplot(diamonds , aes(x = price)) +
  geom_histogram(binwidth = 1000) +
  coord_cartesian(xlim = c(0 , 2000))

R 复制代码
ggplot(diamonds , aes(x = price)) +
  geom_histogram(binwidth = 1000) +
  xlim(c(0 , 2000))

注意

在方块宽度设置不合理时,也可能出现异常方块,例如前者代码由于绘图起点为500,因此[-500,500]这一区间数据会表现为一个整块,但实际上[-500,250]这一区间并无相关数据,仅是绘图结果使然。

相关推荐
九章云极AladdinEdu3 分钟前
深度学习优化器进化史:从SGD到AdamW的原理与选择
linux·服务器·开发语言·网络·人工智能·深度学习·gpu算力
axban5 分钟前
QT M/V架构开发实战:QStandardItemModel介绍
开发语言·数据库·qt
猿究院-赵晨鹤19 分钟前
String、StringBuffer 和 StringBuilder 的区别
java·开发语言
I'm a winner25 分钟前
第五章:Python 数据结构:列表、元组与字典(一)
开发语言·数据结构·python
葵野寺29 分钟前
【RelayMQ】基于 Java 实现轻量级消息队列(九)
java·开发语言·rabbitmq·java-rabbitmq
大白同学4211 小时前
【C++】C++11介绍(Ⅱ)
开发语言·c++
你怎么知道我是队长1 小时前
C语言---存储类
c语言·开发语言
XIAOYU6720131 小时前
金融数学专业需要学哪些数学和编程内容?
开发语言·matlab·金融
油炸自行车1 小时前
【Qt】编写Qt自定义Ui控件步骤
开发语言·c++·qt·ui·自定义ui控件·qt4 自定义ui控件
浪扼飞舟2 小时前
c#基础二(类和对象,构造器调用顺序、访问级别、重写和多态、抽象类和接口)
java·开发语言·c#