R语言都不用安装?单因素生存分析工具在线版等你来用
点击"生信学霸"添加关注,我们一起进步
01
—
研究背景
COX回归模型,又称“比例风险回归模型(proportional hazards model,简称Cox模型)”,是由英国统计学家D.R.Cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为应变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型[1-2]。
对于生存数据,1958年,E. L. Kaplan 和 Paul Meier 两位教授介绍了一种全新的、解决随访期间右删失 (right censoring) 问题的生存分析方法,被称作Kaplan-Meier方法。这种方法精确地记录并利用每个个体发生终点事件的具体时间,在任何一个终点事件发生的时间点计算出一个新的、基于之前所有信息的总生存率 (Cumulative survival)[3-4]
Cox回归分析和KM曲线是做预后分析最常用的两种分析,对于初学者来说,利用R语言来实现这两个分析还是有点难度的,如做cox比例分析和KM曲线结合分析,阈值该怎么选取,数据是否需要标准化等等。
针对初学者的问题,我们开发了一个云平台,只需生存数据导入进去,点击鼠标就可进行cox回归分析和KM曲线分析;
生存分析就是这么简单,你只需跨出注册的第一步,剩下的 Sangerbox都替你走完!
快跟着小编一起学习一下这个工具
网址导航
http://sangerbox.com/Tool 点击“单因素生存分析工具”
02
—
使用方法
模式一
----------
1.1__输入数据
第一列为样本的生存时间,第二列为患者的生存状态(0-代表生存,1-代表死亡)。第三列为对样本生存状态有影响的临床因素,值得注意的是这里的临床变量为连续性变量,如某个基因的的表达值,经过几个基因一起构建预后风险值,如下图所示:
1.2__设置参数,如下图所示。
1.3__解释结果:
点击提交,去个人空间—KMplot目录下(默认目录,也可自定义),结果中包含四张图,如下图所示:A图是根据最优截断值将患者分为高低风险两组的KM曲线,B图是一、三、五这三年的ROC图,C图是根据中位数将患者分为高低风险两组的KM曲线,D图为四分位数分组的KM曲线。
模式二
----------
2.1__输入数据
第一列为样本的生存时间,第二列为患者的生存状态(0-代表生存,1-代表死亡)。第三列为对样本生存状态有影响的临床因素,值得注意的是这里的临床变量为名义性变量,表示样本的某个类型,如临床变量中的性别,TNM分期,TP53突变等,如下图所示:
2.2__设置参数,如下图所示。
2.3__解释结果:
点击提交,去个人空间—TCGA目录下(默认目录,也可自定义),结果为一张KM曲线图,图片上没有显示虚线,说明没有设置显示置信区间,如下图所示:
参考文献
[1] George B, Seals S, Aban I. Survival analysis and regression models. J Nucl Cardiol. 2014;21(4):686‐694.
[2] Fisher LD, Lin DY. Time-dependent covariates in the Cox proportional-hazards regression model. Annu Rev Public Health. 1999;20:145‐157.
[3] Kaplan, E. L., and Paul Meier. “Nonparametric Estimation from Incomplete Observations.” Journal of the American Statistical Association, vol. 53, no. 282, 1958, pp. 457–481.
[4] Saluja R, Cheng S, Delos Santos KA, Chan KKW. Estimating hazard ratios from published Kaplan-Meier survival curves: A methods validation study. Res Synth Methods. 2019;10(3):465‐475.
具体指引详见: