使用R语言中的scatterplotMatrix来绘制散点图矩阵
之前用过R软件做相关系数矩阵热图,见,现在来介绍使用R语言中的scatterplotMatrix来绘制散点图矩阵,比较简单的一个命令就可以,适用于对多变量的分析。
以波士顿Boston的房价数据为例,这个数据是数据挖掘、机器学习中常用的数据,可以到UCI的机器学习数据库去下载:https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data
数据集有506个观测样本,14个变量:
image
首先,将数据导入R软件中:
> mydata<-read.table('E:/Boston-house-prices.csv',head=T,sep=',',stringsAsFactors = FALSE )
> summary(mydata)
接下来安装car包,并进行散点图矩阵分析:
> install.packages("car")
> library(car)
> scatterplotMatrix(mydata,spread=FALSE,lty.smooth=2,main="Scatter Plot Matrix")
得到结果如图所示:
image
从散点图可以看出,MEDV那一行与变量MEDV明显具有线性趋势变化的散点图包括:ZN、RM、BRATIO、LSTAT。