Cox等级资料是个坑

R语言做!初学者先进来看看!!!

SCI冲

COX多因素模型需要满足的条件:

1.各观测值间相互独立,即残差之间不存在自相关;

2.因变量和自变量之间存在线性关系;

3.残差的方差齐;

4.不存在多重共线性;

5.没有显著异常值;

等级资料要除了设置为因子,还有设置顺序

**COX分析:**做临床信息与预后相关的COX分析大致都会分为两个步骤,先做单因素COX回归分析,再根据P值挑选有意义的变量,最终纳入COX多因素回归模型中;这个过程可以利用SPSS进行,当然为了和后续分析结果可视化联系在一起,可能使用R语言会更方便一些;

**R语言COX分析:**上述的单因素COX分析到多因素COX分析的R分析,在网上的教程不少,其中绝大多数都直接从教你如何分析自变量与结局间的关系开始,一直到可视化,这里我也推荐一个B站上的教程,小姐姐带着写代码,每一步都有详细解说,有需要的可以去看看,视频链接为:

【麦子】Cox回归的R操作:从单因素到多因素一气呵成_哔哩哔哩_bilibili​www.bilibili.com/video/av18918951/​编辑

这里必须要提及的是数据问题,肯定有很多初学者在跟着教程跑代码的时候出现了不少error,warning,这主要原因是很多教程使用的数据都是R语言中自带的数据集lung,人家自带的数据能不规范嘛,你再看看你的数据类型符合用coxph()函数做分析的要求嘛???所以接下来,我就我在COX分析过程中遇到的困难给初学者们排排雷;

**数据读取问题:**使用read.table()函数读取部分数据时,会存在数据读取不全,数据缺失的问题,当然不是所有数据都存在这种情况,如果存在这种情况了,或者使用read.table()函数后,不论怎么修改sep="",row.names=也不能将数据正确格式读进来的时候,建议大家将原有的数据存储为UTF-8编码以逗号形式分割的.csv格式,再利用R语言中的read.csv(data,sep=",")函数读取,效果会好不少;

数据缺失值问题:在COX分析中会默认把缺失值直接删除后再做分析,如果某个样本有缺失值,建议把这个样本删除,当然,如果某个变量在样本中的缺失值过多,建议不要将这个变量纳入模型分析;

R包的安装问题 :如果你跟的教程里面用的是install.packages(""),但是你使用这个代码总显示该R语言版本无法下载安装包时,很可能这个代码已经不适用了,这时候不要犹豫,直接在浏览器上搜索这个包的名字,登录这个包相关的官网上,点击installation模块,上面会有更新的安装此包的代码!!!亲测,上案例,COX等比例风险检验所需的survminer包,用install.packages("")已经无了,上官网,再安装;

官网安装代码截图

安装包安装成功的过程

**COX分析中结局数据类型:**生存分析类结局主要分为两种,出现阳性事件,用1表示,未出现阳性事件,用0表示,很多初学者在标注结局时,认为0和1应该是因子型变量,要么原数据就是factor形式,要么就是自己利用factor函数直接改成了因子型变量,最后用COX已分析,报错了:Error in coxph(y ~ 性别, data = data) : an id statement is required for multi-state models;这个错误是由于,COX分析使用的生存分析结局的0和1是数值型变量,你把它变成因子型了,肯定识别不了,这个问题困扰了我一个晚上,我是在网上翻到一篇外国网友的相似问题才知道了原因;

因子型结局变量报错

**变量名问题:**在我的数据变量名中,有包含@符号的,于是有报错了;当然有关变量名还不能包含其他哪些符号,大家一起探索!!!

变量名包含@报错

多因素COX回归分析中变量过多显示收敛不佳: 我最后是有23个变量进入了多因素COX回归模型的建立,没有报错,但是报了warning,也是在国外网站上查到了相似问题,显示由于变量过多引起的;那这个时候你就要重新筛选你的变量了,这个时候我才重新去找COX分析对于因变量和自变量的要求,以下列出,包括各自变量间批次独立,这就需要独立性检验或者回归分析的介入了,如果你觉得现学相关的R代码太麻烦了,那你可以重新捡起来SPSS,网上教程教的很详细,一定要比R代码上手快一些;当然其他有关残差和等比例风险验证的问题,我本人也还没学会,遇到问题了,我们再一起讨论!!!

变量过多收敛不好

相关推荐
小杜的生信筆記1 天前
基于R语言绘制网络图,新人选手上手
开发语言·r语言·生物信息学·组学
机器学习之心HML1 天前
TCN-BiLSTM回归+特征贡献SHAP分析+新数据预测+多输出,MATLAB代码
matlab·数据挖掘·回归
Tiger Z2 天前
《R for Data Science (2e)》免费中文翻译 (第14章) --- Strings(2)
数据分析·r语言·数据科学·免费书籍
每天学点2 天前
R语言 使用bibliometrix包进行文献计量学
r语言·文献计量
暗之星瞳2 天前
线性回归+实例
算法·回归·线性回归
wind_20672 天前
二、数据类型
r语言·r语言-4.2.1
梦想的初衷~2 天前
基于R语言机器学习遥感数据处理与模型空间预测技术及实际项目案例分析
随机森林·机器学习·r语言
子夜江寒2 天前
线性回归与KNN算法的核心原理及实践应用
算法·回归·线性回归
AAIshangyanxiu2 天前
基于R语言机器学习遥感数据处理与模型空间预测技术及实际项目案例分析
开发语言·机器学习·r语言·生态遥感·空间预测
青铜弟弟2 天前
R语言与python升级包的问题
开发语言·python·r语言