R语言绘制常见的4种直方图
对于连续数据,通过直方图来观察分布状态。小兵今天用R语言的ggplot2包上机练习制作几种常见的直方图。
数据源:雇员数据employee
本号后台回复【雇员】下载数据,欢迎读者朋友自行实践。
1.简单直方图
目标:考察初始薪资数据分布。
ggplot(data=employee,aes(salbegin))+geom_histogram()
这是ggplot2默认的配色风格,接下来修改一下柱图的边框颜色、填充颜色,填充色的透明度,让直方图看起来好看一些。
ggplot(data=employee,aes(x=salbegin))+geom_histogram(fill="red",color="black",alpha=0.3)
2.概率密度曲线直方图
目标:考察初始薪资数据分布,附加概率密度曲线。
ggplot(data=employee,aes(x=salbegin))+geom_histogram(aes(y=..density..),colour="black", fill="white")+geom_density(alpha=.2, fill="red")
3.分组直方图
目标:考察不同性别初始薪资数据分布。以性别为分组变量,不同性别不同颜色进行区分。
p <- ggplot(data=employee,aes(x=salbegin,fill=gender))
p+geom_histogram(alpha=0.4,position = "identity")
4.面板直方图
目标:考察不同性别初始薪资数据分布。以性别为面板变量,不同性别不同面板独立出图。
ggplot(data=employee,aes(salbegin))+geom_histogram()+facet_grid(.~gender)
推荐阅读