R语言批量处理植物名信息
今天发现一个不错的植物信息方面的程序包“plantlist”,主要以下几个功能:
01
—
安装程序包
library(devtools)
library(xlsx)
library(stringr)
install_github("helixcn/plantlist")
02
—
代码
直接复制黏贴就好,结果为3.csv
data <- data.frame()#简历数据框
plants<-read.xlsx("植物名录.xlsx",1,header=T,encoding="UTF-8")#读取植物名录
species<-plants[,1]#读取第一列
for (i in 1:length(species)) {
b<-CTPL(species[i])#根据植物名获取信息
f<-b[,3]#根据第三列的拉丁名信息
l<-"×"
ifelse(is.na(f)==T,ifelse(is.na(str_count(f,l)==1)==T,g<-status(0),g<-status(f)),g<-status(f))#判断拉丁名是否为空和是否包含乘号×,包含则跳过
zy <- data.frame(b,g)#数据汇总
data <- rbind(data,zy)#数据框封装
}
write.csv(data,file="./3.csv")#导出数据文件为3.csv
data <- data.frame()#简历数据框
plants<-read.xlsx("植物名录.xlsx",1,header=T,encoding="UTF-8")#读取植物名录
species<-plants[,1]#读取第一列
for (i in 1:length(species)) {
b<-CTPL(species[i])#根据植物名获取信息
zy <- data.frame(b)#数据汇总
data <- rbind(data,zy)#数据框封装
}
write.csv(data,file="./3.csv")#导出数据文件为3.csv
03
—
结果
R语言可视化分析:
详细说明可见:http://blog.sciencenet.cn/blog-255662-846673.html
参考文献:
Jinlong Zhang (2018). plantlist: Looking Up the Status of Plant Scientific Names based on The Plant List Database. R package version 0.5.3. https://github.com/helixcn/plantlist/