内置数据集介绍
state.x77表示美国50个州的八个指标

data.frame函数将多个数据属性合并成一个数据框

查看数据集中指定的包和所有可用的包:
data(package="MASS")
data(package=.packages(all.available = TRUE))

R数据结构
1.数据类型
数值型,字符串型,逻辑型,日期型
2.向量
用函数C来创建向量,C可以表示连接、收集、合并

字符串要加引号,但是逻辑性字符串(大写的)不用加引号

c中可以用冒号生成等差数列,
seq可以设置间隔(by可省略),中间的数值用逗号连接。length.out可以设置输出的个数。

rep生成重复序列,也可以重复某个向量中的值

用x表示对应y中元素循环的次数(此时两个向量个数要一样)

Mode查看向量的数据类型
向量为同一类型才能进行计算。

向量化编程x*2+y,比循环化编程效率很多!!!!

3.向量索引
R中的向量索引从1开始,索引前面加负号-,表示输出除开这个数的其他数

逻辑运算符&只用写一个,
包括判断查找也不用循环!!直接可以判断是否在这个向量中。

通过列名来访问数据
names(y),给向量添加列名(即列属性),之后就可以通过属性名访问对应的数据。

给向量添加赋值,可以在向量指定位置添加,一个或多个都可以

在指定向量数据的前后插入位置用append,其中参数after = 0表示在向量第一个位置前面加元素。

向量的删除和修改:
