Cox等级资料是个坑

R语言做!初学者先进来看看!!!

SCI冲

COX多因素模型需要满足的条件:

1.各观测值间相互独立,即残差之间不存在自相关;

2.因变量和自变量之间存在线性关系;

3.残差的方差齐;

4.不存在多重共线性;

5.没有显著异常值;

等级资料要除了设置为因子,还有设置顺序

**COX分析:**做临床信息与预后相关的COX分析大致都会分为两个步骤,先做单因素COX回归分析,再根据P值挑选有意义的变量,最终纳入COX多因素回归模型中;这个过程可以利用SPSS进行,当然为了和后续分析结果可视化联系在一起,可能使用R语言会更方便一些;

**R语言COX分析:**上述的单因素COX分析到多因素COX分析的R分析,在网上的教程不少,其中绝大多数都直接从教你如何分析自变量与结局间的关系开始,一直到可视化,这里我也推荐一个B站上的教程,小姐姐带着写代码,每一步都有详细解说,有需要的可以去看看,视频链接为:

【麦子】Cox回归的R操作:从单因素到多因素一气呵成_哔哩哔哩_bilibili​www.bilibili.com/video/av18918951/​编辑

这里必须要提及的是数据问题,肯定有很多初学者在跟着教程跑代码的时候出现了不少error,warning,这主要原因是很多教程使用的数据都是R语言中自带的数据集lung,人家自带的数据能不规范嘛,你再看看你的数据类型符合用coxph()函数做分析的要求嘛???所以接下来,我就我在COX分析过程中遇到的困难给初学者们排排雷;

**数据读取问题:**使用read.table()函数读取部分数据时,会存在数据读取不全,数据缺失的问题,当然不是所有数据都存在这种情况,如果存在这种情况了,或者使用read.table()函数后,不论怎么修改sep="",row.names=也不能将数据正确格式读进来的时候,建议大家将原有的数据存储为UTF-8编码以逗号形式分割的.csv格式,再利用R语言中的read.csv(data,sep=",")函数读取,效果会好不少;

数据缺失值问题:在COX分析中会默认把缺失值直接删除后再做分析,如果某个样本有缺失值,建议把这个样本删除,当然,如果某个变量在样本中的缺失值过多,建议不要将这个变量纳入模型分析;

R包的安装问题 :如果你跟的教程里面用的是install.packages(""),但是你使用这个代码总显示该R语言版本无法下载安装包时,很可能这个代码已经不适用了,这时候不要犹豫,直接在浏览器上搜索这个包的名字,登录这个包相关的官网上,点击installation模块,上面会有更新的安装此包的代码!!!亲测,上案例,COX等比例风险检验所需的survminer包,用install.packages("")已经无了,上官网,再安装;

官网安装代码截图

安装包安装成功的过程

**COX分析中结局数据类型:**生存分析类结局主要分为两种,出现阳性事件,用1表示,未出现阳性事件,用0表示,很多初学者在标注结局时,认为0和1应该是因子型变量,要么原数据就是factor形式,要么就是自己利用factor函数直接改成了因子型变量,最后用COX已分析,报错了:Error in coxph(y ~ 性别, data = data) : an id statement is required for multi-state models;这个错误是由于,COX分析使用的生存分析结局的0和1是数值型变量,你把它变成因子型了,肯定识别不了,这个问题困扰了我一个晚上,我是在网上翻到一篇外国网友的相似问题才知道了原因;

因子型结局变量报错

**变量名问题:**在我的数据变量名中,有包含@符号的,于是有报错了;当然有关变量名还不能包含其他哪些符号,大家一起探索!!!

变量名包含@报错

多因素COX回归分析中变量过多显示收敛不佳: 我最后是有23个变量进入了多因素COX回归模型的建立,没有报错,但是报了warning,也是在国外网站上查到了相似问题,显示由于变量过多引起的;那这个时候你就要重新筛选你的变量了,这个时候我才重新去找COX分析对于因变量和自变量的要求,以下列出,包括各自变量间批次独立,这就需要独立性检验或者回归分析的介入了,如果你觉得现学相关的R代码太麻烦了,那你可以重新捡起来SPSS,网上教程教的很详细,一定要比R代码上手快一些;当然其他有关残差和等比例风险验证的问题,我本人也还没学会,遇到问题了,我们再一起讨论!!!

变量过多收敛不好

相关推荐
环能jvav大师15 小时前
基于R语言的统计分析基础:使用dplyr包进行数据操作
大数据·开发语言·数据分析·r语言
环能jvav大师21 小时前
基于R语言的统计分析基础:使用SQL语句操作数据集
开发语言·数据库·sql·数据分析·r语言·sqlite
y_dd1 天前
【machine learning-七-线性回归之成本函数】
算法·回归·线性回归
惟长堤一痕1 天前
医学数据分析实训 项目四回归分析--预测帕金森病病情的严重程度
数据挖掘·数据分析·回归
一声沧海笑2 天前
dplyr、tidyverse和ggplot2初探
信息可视化·数据分析·r语言
waterHBO2 天前
R语言 基础笔记
开发语言·笔记·r语言
Red Red2 天前
GEO数据库提取疾病样本和正常样本|GEO数据库区分疾病和正常样本|直接用|生物信息|生信
开发语言·数据库·笔记·学习·r语言·c#·生物信息
Kenneth風车2 天前
【机器学习(七)】分类和回归任务-K-近邻 (KNN)算法-Sentosa_DSML社区版
人工智能·算法·低代码·机器学习·分类·数据分析·回归
水木流年追梦3 天前
【python因果推断库16】使用 PyMC 模型进行回归拐点设计
开发语言·python·回归
沅_Yuan4 天前
Transformer-Adaboost多输入单输出回归预测神经网络【MATLAB】
神经网络·回归·transformer