vlambda博客
学习文章列表

R语言之cox回归分析

   

    Cox比例风险模型(Cox proportional-hazards model,也称为Cox回归),主要用于带有时间的生存结局的影响因素研究,或评价某个临床治疗措施对患者生存的影响。

    Cox模型可以由hazard function表示,h(t);简单的说就是t时刻死亡的风险,公式如下:

 h(t)=h0(t) × exp(b1x1 + b2x2 +…+ bpxp)

  •  t代表生存时间

  •  x1-xp代表协变量

  •  b1-bp代表协变量的回归系数


 R语言代码实现:

install.packages("survival")

library(survival)    

sur<-Surv(time,status,data=test)

#单因素Cox回归分析各个因素与患者生存的关系

summary(coxph(sur~x1,data=test))

#多因素Cox回归分析各个因素与患者生存的关系

summary(coxph(sur~x1+x2+x3,data=test))


单因素Cox回归分析结果


多因素Cox回归分析结果

结果解释

1、coef是公式中的回归系数b(有时也叫做beta值),因此exp(coef)则是Cox模型中最主要的概念风险比(HR-hazard ratio):

  • HR = 1: No effect

  • HR < 1: Reduction in the hazard

  • HR > 1: Increase in Hazard

在癌症研究中:

    hazard ratio > 1 is called bad prognostic factor

    hazard ratio < 1 is called good prognostic factor

2、z值代表Wald统计量,其值等于回归系数coef除以其标准误se(coef),即z = coef/se(coef);有统计量必有其对应的假设检验的显著性P值,其说明bata值是否与0有统计学意义上的显著差别

3、coef(-0.5310)值小于0说明HR值小于1,而这里的Cox模型是group two相对于group one而言的,那么按照测试数据集来说:male=1,female=1,即女性的死亡风险相比男性要低

4、exp(coef)等于0.59,即风险比例等于0.59,说明女性(male=2)减少了0.59倍风险,女性与良好预后相关

5、ower .95 upper .95则是exp(coef)的95%置信区间

6、Likelihood ratio test,Wald test,Score (logrank) test则是给出了3种可选择的P值,这三者是asymptotically equivalent;当样本数目足够大时,这三者的值是相似的;当样本数目较少时,这三者是有差别的,但是Likelihood ratio test会比其他两种在小样本中表现的更优