从0开始学习R语言--Day47--Nomogram

我们在用回归做医疗数据的分析时,往往需要知道病人的存活率,但这里的存活率往往指的是各种排列组合的存活率,但是直接输出所有分组又很浪费计算量,且在结果中找我们想要的组合也很费力。

而nomogram则提供了一种计分的方式,通过给不同分组的每种情况赋分,判断贡献,让我们可以直接观察我们关心数据的区间,从而直接知晓所要分类的病人的生存率。

以下是一个例子:

R 复制代码
# 加载必要的包
library(regplot)

# 生成模拟数据
set.seed(123)
n <- 200
data <- data.frame(
  年龄 = round(rnorm(n, mean = 60, sd = 10)),
  肿瘤大小 = round(runif(n, min = 1, max = 5), 1),
  吸烟 = factor(sample(c("是", "否"), n, replace = TRUE, prob = c(0.3, 0.7))),
  生存状态 = factor(sample(c("死亡", "存活"), n, replace = TRUE, prob = c(0.4, 0.6)))
)

# 拟合逻辑回归模型
model <- glm(生存状态 ~ 年龄 + 肿瘤大小 + 吸烟, 
             family = binomial(link = "logit"), 
             data = data)

# 绘制 Nomogram
regplot(model,
        points = TRUE,          # 显示点刻度
        odds = TRUE,            # 显示OR值
        failtime = c(1, 3, 5),  # 如果做生存分析可设置时间点
        title = "Nomogram 预测模型")

输出:

R 复制代码
[[1]]
      吸烟 Points
吸烟2   是     46
吸烟1   否     58

[[2]]
  肿瘤大小 Points
1        1     24
2        2     41
3        3     58
4        4     75
5        5     92

[[3]]
   年龄 Points
1    35    104
2    40     95
3    45     85
4    50     76
5    55     67
6    60     58
7    65     49
8    70     40
9    75     31
10   80     22
11   85     13
12   90      4
13   95     -5

[[4]]
   Total Points Pr( 生存状态 )
1            80         0.2577
2           100         0.2850
3           120         0.3139
4           140         0.3443
5           160         0.3761
6           180         0.4090
7           200         0.4427
8           220         0.4770
9           240         0.5114
10          260         0.5458
11          280         0.5797

在图中可以看到,年龄对死亡风险的影响最大,吸烟的影响相对较小。对于年龄来说,每增加5岁,分数减少约9分,即年龄越大,死亡风险越高;肿瘤则是每增加1cm,分数增加约17分,这里看起来相反,实际上是因为两者的系数正负不一样,所以才这样分析。

相关推荐
励志不掉头发的内向程序员7 分钟前
从零开始的python学习——函数(2)
开发语言·python·学习
范纹杉想快点毕业2 小时前
数据结构与算法个人学习代码笔记包含leetcode,海贼oj,蓝桥杯,ACM
java·开发语言·笔记·学习·算法·leetcode·蓝桥杯
wdfk_prog2 小时前
[Linux]学习笔记系列 -- mm/slub.c SLUB内存分配器(The SLUB Allocator) 现代内核对象缓存的核心
java·linux·运维·c语言·笔记·学习·缓存
g_i_a_o_giao3 小时前
Android8 从系统启动到用户见到第一个Activity的流程源码分析(三)
android·linux·笔记·学习·安卓framework开发·安卓源码分析
星星火柴9363 小时前
C++“类吸血鬼幸存者”游戏制作的要点学习
c++·笔记·学习·游戏
2025年一定要上岸3 小时前
【日常学习】2025-9-2 学习控件Day1
学习
永日456703 小时前
学习日记-SpringMVC-day48-9.2
学习
悠哉悠哉愿意4 小时前
【机器学习学习笔记】Matplotlib 基本操作
笔记·学习·机器学习
胡萝卜3.05 小时前
【LeetCode&数据结构】栈和队列的应用
数据结构·学习·算法··队列·栈和队列oj题
mengjiexu_cn5 小时前
强化学习PPO/DDPG算法学习记录
python·学习·算法