vlambda博客
学习文章列表

R语言——描述统计(1)Day11


今天我们学习描述统计





描述统计





1、summary( )

> myvars <- c("mpg", "hp", "wt") 
> summary(mtcars[myvars])
      mpg              hp              wt      
 Min.:10.40   Min.: 52.0   Min.:1.513 
1stQu.:15.43  1st Qu.: 96.5   1st Qu.:2.581 
Median:19.20 Median:123.0  Median :3.325 
Mean :20.09   Mean  :146.7   Mean   :3.217 
3rdQu.:22.80 3rd Qu.:180.0   3rd Qu.:3.610 
 Max. :33.90   Max.   :335.0   Max.   :5.424 

mtcars是一个数据库,mpg,hp,wt是数据库中的三个量,summary可以求出最小数,下四分位数,中位数,平均数,上四分位数和最大数。

mtcars数据库32种车型的统计量里面有11个量,选的时候可以不选这三个,可以选其他的。

2、sapply(数据,函数,options)

函数主要有:mean()均值、sd()标准差、var()方差、min()最小值、max()最大值、median()中位数、length()长度、range()极差和quantile()分位数

> myvars <- c("mpg", "hp", "wt") 

> sapply(mtcars[myvars],max)
    mpg      hp      wt
 33.900 335.000   5.424

求mtcars数据库里mpg,hp,wt他们的最大值

> myvars <- c("mpg", "hp", "wt")
> sapply(mtcars[myvars],quantile)
        mpg    hp      wt
0%   10.400  52.0 1.51300
25%  15.425  96.5 2.58125
50%  19.200 123.0 3.32500
75%  22.800 180.0 3.61000
100% 33.900 335.0 5.42400

求mtcars数据库里mpg,hp,wt他们的分位数

> chinese<-c(90,100,94) 
> math<-c(85,90,110)  
> score<-data.frame(chinese,math)
> summary(score)
            chinese            math     
 Min.    : 90.00    Min.   : 85.0 
 1st Qu.: 92.00   1st Qu.: 87.5 
 Median : 94.00   Median : 90.0 
 Mean   : 94.67    Mean   : 95.0 
 3rd Qu.: 97.00    3rd Qu.:100.0 
 Max.   :100.00    Max.   :110.0 


> chinese<-c(90,100,94) 
> math<-c(85,90,110)  
> score<-data.frame(chinese,math)
> sapply(score,quantile)
           chinese  math
0%        90        85.0
25%       92        87.5
50%       94        90.0
75%       97       100.0
100%     100      110.0

创建了一个数据库,然后查看它们的描述统计量,第二种是查看他的分位数。

数据可以是数据框也可以是矩阵。


summary(),sapply()这两个是R语言中内置的,describe()是Hmisc包里的,describe()是psych包里的,stat.desc()是pastecs包里的。我们之前没有讲如何安装包,因为小编今天有事儿时间比较紧,所以后面这三个我们明天讲,明天再讲一下如何安装包,今天的学习就到这里,有问题的话欢迎大家留言,我们明天见,谢谢大家。

固定布局                                                        
工具条上设置固定宽高
背景可以设置被包含
可以完美对齐背景图和文字
以及制作自己的模板