R语言之cox回归分析
Cox比例风险模型(Cox proportional-hazards model,也称为Cox回归),主要用于带有时间的生存结局的影响因素研究,或评价某个临床治疗措施对患者生存的影响。
Cox模型可以由hazard function表示,h(t);简单的说就是t时刻死亡的风险,公式如下:
h(t)=h0(t) × exp(b1x1 + b2x2 +…+ bpxp)
t代表生存时间
x1-xp代表协变量
b1-bp代表协变量的回归系数
R语言代码实现:
install.packages("survival")
library(survival)
sur<-Surv(time,status,data=test)
#单因素Cox回归分析各个因素与患者生存的关系
summary(coxph(sur~x1,data=test))
#多因素Cox回归分析各个因素与患者生存的关系
summary(coxph(sur~x1+x2+x3,data=test))
单因素Cox回归分析结果
多因素Cox回归分析结果
结果解释:
1、coef是公式中的回归系数b(有时也叫做beta值),因此exp(coef)则是Cox模型中最主要的概念风险比(HR-hazard ratio):
HR = 1: No effect
HR < 1: Reduction in the hazard
HR > 1: Increase in Hazard
在癌症研究中:
hazard ratio > 1 is called bad prognostic factor
hazard ratio < 1 is called good prognostic factor
2、z值代表Wald统计量,其值等于回归系数coef除以其标准误se(coef),即z = coef/se(coef);有统计量必有其对应的假设检验的显著性P值,其说明bata值是否与0有统计学意义上的显著差别
3、coef(-0.5310)值小于0说明HR值小于1,而这里的Cox模型是group two相对于group one而言的,那么按照测试数据集来说:male=1,female=1,即女性的死亡风险相比男性要低
4、exp(coef)等于0.59,即风险比例等于0.59,说明女性(male=2)减少了0.59倍风险,女性与良好预后相关
5、
ower .95 upper .95则是exp(coef)的95%置信区间
6、
Likelihood ratio test,Wald test,Score (logrank) test则是给出了3种可选择的P值,这三者是asymptotically equivalent;当样本数目足够大时,这三者的值是相似的;当样本数目较少时,这三者是有差别的,但是Likelihood ratio test会比其他两种在小样本中表现的更优