《R语言医学数据分析实践 李丹 宋立桓 蔡伟祺 清华大学出版社9787302673484》【摘要 书评 试读】- 京东图书 (jd.com)
在医学领域中,R语言的数据框(data frame)是一种非常常用的数据结构,用于存储和处理医学数据。数据框中可以包含多种类型的数据,如患者姓名、年龄、性别、体重、症状、诊断结果等信息,便于医学研究人员对数据进行整理、分析和可视化。
在R语言中,数据框提供了丰富的函数和方法,使医学研究人员能够方便地处理和分析医学数据。通过结合数据框和其他R语言的数据分析工具,医学工作者可以更快速地从大量的医学数据中提取有用信息,为医学研究和临床实践提供支持。创建数据库的R代码如下:
patient_data <- data.frame(
Patient_ID = c(1, 2, 3, 4),
Age = c(35, 42, 28, 56),
Gender = c("Male", "Female", "Male", "Female"),
Diagnosis = c("Hypertension", "Diabetes", "Obesity", "Heart Disease")
) #创建数据框
patient_data #查看数据框
patient_data$Age
patient_data[,2]
subset(patient_data, Age > 36)
代码运行结果如下图所示,创建了一个包含患者ID、年龄、性别和诊断结果的数据框。当我们要访问数据框中的元素时,可以使用符号或\[row,col\]的方式。例如,可以使用patient_dataAge或patient_data[,2]来访问病人的年龄数据。当我们要按照条件提取数据框的内容时,可以使用subset()函数。例如,使用subset(patient_data, Age > 36)来筛选年龄大于36岁的病人信息。
另外,介绍一下基础的数据集合并操作cbind。cbind是按列进行合并,即把所有列叠加在一起。m 列的矩阵与n 列的矩阵执行cbind()操作后变成m +n列。合并的前提是,cbind(a, c)中的矩阵a与矩阵c的行数必须相同。R代码如下:
num<-c(1,2,3,4)
letter<-c("A","F","C","D")
score<-c(60,80,50,90)
sex<-c("M","F","M","M")
df1<-data.frame(num,letter)
df2<-data.frame(score,sex)
cb<-cbind(df1,df2)
print(cb)
代码运行结果如下图所示,把两个行数相同的矩阵合并为一个新的矩阵。