R语言—组间显著性检验及其可视化
本期给大家带来R语言—组间显著性检验及其可视化。
首先准备测试数据,格式见下图:
贴心小编给没有数据的同学备好测试数据,拿走不谢:
链接:https://pan.baidu.com/s/1vOAKfpZCDZgj95CGn766dw 提取码:q1j6
首先安装以下包:
安装命令如下(如已安装可直接加载):
安装成功后加载以下包:
#读入数据
data<-read.table("test_data1.txt",header=T,sep="\t")
#宽数据转换为长数据
dat<-melt(data)
#转换后的数据重新命名列名
names(dat)<-c("group","value")
#多组组间显著性检验,本次我们采用anova检验并作图,如申明method = "anova",否则默认采用的是kruskal.test
ggboxplot(dat, x = "group", y = "value",color = "group", palette = "group")+stat_compare_means(method = "anova")
# label.y自定义标签的位置
ggboxplot(dat, x = "group", y = "value",color = "group", palette = "group")+
stat_compare_means(method = "anova",label.y = max(dat$value))
#以组进行填充
ggboxplot(dat, x = "group", y = "value", palette = "group",fill="group")+
stat_compare_means(method = "anova",label.y = max(dat$value)+0.05)
#以小提琴的方式可视化
ggviolin(dat, x = "group", y = "value",color = "group", palette = "group")+
stat_compare_means(method = "anova",label.y = max(dat$value)+0.15)
#组与组之间显著性可自定义比较
my_comparisons <- list( c("A", "B"), c("A", "C"), c("B", "C"), c("C", "D"), c("C","E"), c("E","F") ,c("B","F"))
ggboxplot(dat, x = "group", y = "value",color = "group", palette = "group")+
stat_compare_means(method = "anova", label.y = max(dat$value)+0.5)+
stat_compare_means(comparisons = my_comparisons)
#用*来代替p值进行显著性显示
ggboxplot(dat, x = "group", y = "value",color = "group", palette = "group")+stat_compare_means(method = "anova", label.y = max(dat$value)+0.5)+stat_compare_means(comparisons =
my_comparisons,aes(label = ..p.signif..),method = "t.test", ref.group = "0.5")
☞注:两两比对如需用T-test,需要对数据检验是否符合正态分布,可使用Shapiro-Wilk方法进行正态检验。如何检验此处暂不揭晓,如有想了解的同学,可留言给我们哦。
#用*来代替p值显示,检验方式选择wilcox.test
ggboxplot(dat, x = "group", y = "value",color = "group", palette = "group")+
stat_compare_means(method = "anova", label.y = max(dat$value)+0.5)+
stat_compare_means(comparisons = my_comparisons,aes(label = ..p.signif..),method = "wilcox.test", ref.group = "0.5")
若同一组有不同的梯度,两组之间不同梯度比较可采用以下方式
数据格式如下:
#读入数据集
data<-read.table("test_data2.txt",header=T,sep="\t")
#两两之间显著性检验,默认采用的是wilcox.test
ggboxplot(data,x = "group", y = "value",color = "group", palette = "group",add = "jitter",facet.by = "level",short.panel.labs = FALSE)+
stat_compare_means(aes(label = paste0("p = ", ..p.format..)))
#也可用小提琴图来可视化
ggviolin(data,x = "group", y = "value",color = "group", palette = "group",add = "jitter",facet.by = "level",short.panel.labs = FALSE)+
stat_compare_means(label.y = max(data$value)+0.05,aes(label = paste0("p = ", ..p.format..)))
本期R语言小技能就解读到这里啦,你get到了吗?拿着测试数据操作一下,包你一学就会!想学习更多知识,就要紧跟我们的步伐,五月特为您推出“网络精讲班”实战式传授代谢组学分析方法,并且打破单一组学限制,结合微生物多样性(16S测序)领域讲解多组学联合分析的方法和思路,深入探讨代谢组学的研究应用,让您能够系统掌握代谢组学的分析技能。机会难得,赶紧了解一下☟☟
金牌培训班预览
集思慧远|微生物代谢组学线上培训班
(四天 网络精讲班 时间:2020.5.6~5.9号)
对代谢组学概述及发展、研究内容、常用数据库、多元变量统计、代谢物筛选、功能模块挖掘、微生物与代谢物关联分析等进行深入浅出的讲解与培训。
课程安排:
报名须知及学习费用
报名须知
扫码填写报名表,负责人员会在1-2个工作日内与您联系。
(2)联系当地销售进行报名。
报名缴费
(1)培训费2200元/人,线上培训,互动性强,打包详细的自学资料和视频课件。
(2)学生凭学生证可享受学生优惠价8.5折,同一单位3人(含)以上报名,享团体优惠价8.5折。
(4)不要发票的老师也可享受优惠价8折。
付款方式
公对公转账
开户名称:南京集思慧远生物科技有限公司
开户行:南京银行股份有限公司城东支行
账号:01500120210019812
*转账备注中请注明“姓名+单位名称+微生物代谢组培训”。
需支付宝转账的同学个别交流!
更多详细信息,请咨询
联系人:张老师
杨丽 | 文案
Brintey | 编辑