R语言对列线图评分进行危险分层

列线图,又称诺莫图(Nomogram),它是建立在回归分析的基础上,使用多个临床指标或者生物属性,然后采用带有分数高低的线段,从而达到设置的目的:基于多个变量的值预测一定的临床结局或者某类事件发生的概率。列线图(Nomogram)可以用于多指标联合诊断或预测疾病发病或进展。

近些年来在高质量SCI临床论文中用的越来越多。列线图将回归模型转换成了可以直观的视图,让结果更容易判断,具有可读性。

关于列线图的文章公众号已经介绍非常多了,粉丝私信问,如何进行风险分层,今天来演示一下,继续使用咱们的乳腺癌数据,(公众号回复:乳腺癌,可以获得该数据),

r 复制代码
library(foreign)
library(rms)
bc <- read.spss("E:/r/Breast cancer survival agec.sav",
                use.value.labels=F, to.data.frame=T)
bc<-na.omit(bc)

age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素受体状态,pr表示孕激素受体状态,status结局事件是否死亡,pathscat表示病理肿瘤大小类别(分组变量),ln_yesno表示是否有淋巴结肿大,time是生存时间,后面的agec是我们自己设定的,不用管它。

对数据格式进行整理,这里多提一句,数据尽量不要又缺失值,不然容易有各种各样的报错。

r 复制代码
dd<-datadist(bc)
options(datadist="dd")

建立模型,surv=T,这一句一定要有,不然后面没法做

r 复制代码
f<-cph(Surv(time,status)~er+histgrad+pr+age+ln_yesno,x=T, y=T, surv=T,bc)

生成一个可以生成预测概率的函数

r 复制代码
surv <- Survival(f)

生成列线图并绘图

r 复制代码
nom <- nomogram(f, fun=list(function(x) surv(36, x), function(x) surv(60, x), 
                            function(x) surv(120, x)), lp=F, funlabel=c("3-year survival", "5-year survival", "10-year survival"),
                maxscale=10, fun.at=c(0.95, 0.9, 0.85, 0.8, 0.75, 0.7, 0.6, 0.5))
plot(nom)

所谓分线分层其实就是对总评分(total points)这个指标的分数进行分段,咱们要先把这个指标提取出来,需要使用到nomogramFormula包,咱们先把这个包导入

r 复制代码
library(nomogramFormula)
options(datadist="dd")
results <- formula_rd(nomogram = nom)

这样结果就提取出来了,咱们使用points_cal函数进一步把分数提取出来

r 复制代码
points<-points_cal(formula = results$formula,rd=bc)

得到数据后怎么分层就看你的临床意义了,这里我直接平均分3段

r 复制代码
table(cut2(points, g=3))

这样结果就出来啦,0.714,-7.8分是低风险,7.797-11.1分是中风险,11.100-19.6分是高风险。

下面这种列线图我还暂时不会,需要专门写个包才行,以后有空在研究一下

相关推荐
czhc11400756632 天前
LINUX913 shell:set ip [lindex $argv 0],\r,send_user,spawn ssh root@ip “cat “
tcp/ip·r语言·ssh
zhangfeng11332 天前
win7 R 4.4.0和RStudio1.25的版本兼容性以及系统区域设置有关 导致Plots绘图面板被禁用,但是单独页面显示
开发语言·人工智能·r语言·生物信息
zhangfeng11332 天前
在 R 语言里,`$` 只有一个作用 按名字提取“列表型”对象里的单个元素 对象 $ 名字
开发语言·windows·r语言
高-老师2 天前
R语言生物群落(生态)数据统计分析与绘图实践技术应用
开发语言·r语言·生物群落
WangYan20223 天前
R语言:数据读取与重构、试验设计(RCB/BIB/正交/析因)、ggplot2高级绘图与统计检验(t检验/方差分析/PCA/聚类)
r语言·ggplot2·dplyr
zhangfeng11333 天前
错误于make.names(vnames, unique = TRUE): invalid multibyte string 9 使用 R 语言进行数据处理时
开发语言·r语言·生物信息
zhangfeng11334 天前
R geo 然后读取数据的时候 make.names(vnames, unique = TRUE): invalid multibyte string 9
开发语言·chrome·r语言·生物信息
梦想的初衷~5 天前
R语言生物群落数据分析全流程:从数据清洗到混合模型与结构方程
机器学习·r语言·生态·环境
没有梦想的咸鱼185-1037-16637 天前
基于R语言机器学习方法在生态经济学领域中的实践技术应用
开发语言·机器学习·数据分析·r语言
zhangfeng11337 天前
R 语法高亮为什么没有,是需要安装专用的编辑软件,R语言自带的R-gui 功能还是比较简单
开发语言·r语言