vlambda博客
学习文章列表

R语言统计(02)——合并不等数据矩阵

你是否有时存在这样一个问题:我测了两次高通量数据,两次样地不同(列数不同),得到的序列(行数不同)也不同,但是我想把两个数据合并起来分析,有什么快速方法可解决上述问题了呢?
R基础内置函数merge()可满足上述问题所有解决方法。
供试数据共两个,d1为5个样地(H1-H5),4个OTU丰度数据;d2为4个样地(H1、H3-H5),4个OTU数据,数据展示如下:

d1数据集

d2数据集
代码如下:
d1 <- read.csv('d1.csv', header = T)#读入d1数据;d2 <- read.csv('d2.csv', header = T)#读入d2数据;d3 <- merge(d1,d2,  all = T)#合并d1和d2数据,all=T:合并所有的行和列,缺少的值默认用NA替代d3[is.na(d3)] <- 0#把NA值全部替换为0;d3#查看合并后的d3数据集。
合并完成的d3数据如下:

merge函数对于合并不等数据矩阵拥有快速合并的优点,效率较高。推荐各位尝试使用。
欢迎交流!