R语言学习之路(四)
生存曲线的R语言
生存曲线简介
生存曲线是用图表示一个种群的生存状况或死亡过程。一般以存活数量的对数值为纵坐标,以年龄为横坐标作图。1958年,Edward L.Kaplan和Paul Meier首次在临床研究中提出了生存曲线的概念,因此又被称为Kaplan-Meier曲线,主要用于对各组患者的生存状况进行描述。
函数介绍
ggsurvplot(
fit,
data = NULL,
fun = NULL,
color = NULL,
palette = NULL,
linetype = 1,
conf.int = FALSE,
pval = FALSE,
pval.method = FALSE,
test.for.trend = FALSE,
surv.median.line = "none",
risk.table = FALSE,
cumevents = FALSE,
cumcensor = FALSE,
tables.height = 0.25,
group.by = NULL,
facet.by = NULL,
add.all = FALSE,
combine = FALSE,
ggtheme = theme_survminer(),
tables.theme = ggtheme,
...)
#ggsurvplot()是绘制生存曲线的通用函数。具体参数的含义,可在R语言中通过?ggsurvplot获得帮助。所有参数在不设置的情况下,均为默认值。
survfit() #根据公式创建生存曲线
surv(time, status) #如果是自己的数据集,将时间和状态改为自己的标签即可
操作步骤
> library(ggplot2)
> library("survminer")
> library(survival)
> fit<- survfit(Surv(time, status) ~ sex, data = lung)
> ggsurvplot(fit, data = lung,title = "Survival curves",subtitle = "Based on Kaplan-Meier estimates",font.title = c(16, "bold", "darkblue"),font.subtitle = c(15, "bold.italic","purple"), font.caption = c(14, "plain", "orange"), font.x= c(14, "bold.italic", "red"),risk.table =TRUE,pval = TRUE,pval.method = TRUE)
#此处用的数据是R自带的数据lung,如果处理自己的数据,可先将数据存入工作目录中,然后lung改为自己的数据名称即可 font.title = c(16, "bold", "darkblue"),font.subtitle = c(15, "bold.italic","purple"), font.caption = c(14, "plain", "orange"), font.x= c(14, "bold.italic", "red") 这些均为调整字体大小的函数。
典型实例
Tips
1.SPSS,R语言,Stata,SAS由于都是外国人设计的分析软件,因此输入函数时,一定要记住切换输入法为英文,否则会导致输入的标点符号或者括号系统无法识别
2.如何输入数据是学习每一个软件必须要首先学会的技能,但单纯讨论如何输入数据又显得有些无聊,因此,主要放在实例中,穿插学习。
3.使用Rstudio可视化程度更高,二者语言没有区别,但Rstudio可视化程度更高,也更加傻瓜式。
4.图标的详细调整可以慢慢学习,先通过R自带的一些数据包学会了基本的函数之后,再进行灵活应用。