vlambda博客
学习文章列表

使用R语言中的scatterplotMatrix来绘制散点图矩阵

之前用过R软件做相关系数矩阵热图,见,现在来介绍使用R语言中的scatterplotMatrix来绘制散点图矩阵,比较简单的一个命令就可以,适用于对多变量的分析。



以波士顿Boston的房价数据为例,这个数据是数据挖掘、机器学习中常用的数据,可以到UCI的机器学习数据库去下载:https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data

数据集有506个观测样本,14个变量:

使用R语言中的scatterplotMatrix来绘制散点图矩阵

image

首先,将数据导入R软件中:

> mydata<-read.table('E:/Boston-house-prices.csv',head=T,sep=',',stringsAsFactors = FALSE )
> summary(mydata)

接下来安装car包,并进行散点图矩阵分析:

> install.packages("car")
> library(car)
> scatterplotMatrix(mydata,spread=FALSE,lty.smooth=2,main="Scatter Plot Matrix")

得到结果如图所示:

image

从散点图可以看出,MEDV那一行与变量MEDV明显具有线性趋势变化的散点图包括:ZN、RM、BRATIO、LSTAT。