R语言如何在散点图中进行样本点标记?
1 读取数据集,并查看数据集。
test_data=read.csv("test_data.csv")#读取数据集
head(test_data) #查看数据前五行
str(test_data) #查看数据变量属性
可以看到该数据集中主要age、weight两个变量。
2 绘制age、weight变量的散点图。
plot(test_data$age,test_data$weight) #在散点图中画出所有样本点。
3 获取需要突出显示的样本点。
假设我们想在图中看到name为“Lucy”和"John"两个人的年龄和体重,这里设计标记。
L=which(test_data$name=="Lucy");L
J=which(test_data$name=="John");J
我们需要查看的分别是第5和第13个样本点。
4 在散点图中突出标记样本点。
points(test_data[c(L,J),-1],pch=8,col="blue") #利用蓝色星形标记
5 为标记点添加图例。
legend(test_data$age[L],test_data$weight[L],test_data$name[L],bty="n",text.col="red",xjust=0.5,cex=0.8) #标出Lucy所在位置
legend(test_data$age[J],test_data$weight[J],test_data$name[J],bty="n",text.col="red",xjust=0.5,yjust=-0.1,cex=0.8)#标出John所在位置
6 其他标记。
A=which.max(test_data$age)#年龄最大的样本点
points(test_data[A,-1],pch=8,col="green")#标出点的位置
legend(test_data$age[A],test_data$weight[A],test_data$name[A],bty="n",text.col="red",xjust=0.5,yjust=-0.1,cex=0.8)#添加图例
有时候需要查看年龄最小、体重最高的数据等等,根据需要添加标记即可。