vlambda博客
学习文章列表

R语言—统计函数(1)

之前的文章介绍了非常强大的tidyr包和dplyr包可以对数据进行格式转化、缺失值处理、数据的整合连接等一系列的操作。之后,我们就要对数据进行统计分析,这时候就要用到非常多的与统计相关的函数,比如概率分布函数、频数统计函数、独立性检验的函数等等。

图片来源于B站

频数和频率的统计在数据分析时是一个非常基本并且重要的一个步骤,比如说在分析不同组之间的差异时,都要先进行频数的处理,下面主要介绍用table函数进行频数统计的用法。
频数统计的过程也称作是创建列联表的过程,可分为一维列联表、二维列联表和三维列联表,下面会逐一列举不同列联表的创建。 (以下代码均由R 4.0.1版本创建)

#一维列联表

>mtcars$cyl<-as.factor(mtcars$cyl)#转化为因子

>split(mtcars,mtcars$cyl)#对其进行分组

>cut(mtcars$mpg,c(seq(10,50,10)))#将数据分为4个区间

>table(cut(mtcars$mpg,c(seq(10,50,10))))#统计不同区间内的频数

>prop.table(table(mtcars$mpg))*100#计算频率值

#二维列联表

>mtcars

>table(mtcars$mpg,mtcars$cyl)

>with(data=mtcars,table(mpg,cyl))

>xtabs(~mpg+cyl,data=mtcars)

>x<-xtabs(~mpg+cyl,data=mtcars)

>margin.table(x)#频数统计,可单独按照行和列进行处理

>margin.table(x,1)#按行统计

>margin.table(x,2)#按列统计

>addmargins(x)#添加到频数表中

>addmargins(x,1)#添加行

>addmargins(x,2)#添加列

#三维列联表

>y<-xtabs(~mpg+cyl+disp,data=mtcars)

>ftable(y)#将三维转换为平铺式

我将这些语句放在了R脚本中,可以直接导入运行,需要的朋友可以私信我哦!

扫描二维码

获取更多精彩

大康的笔记

R语言—统计函数(1)