vlambda博客
学习文章列表

R语言 | 主成分、因子、对应分析及R使用




- 主成分分析 -


主成分分析,简称PCA,是将多个指标化为少数几个综合指标的一种统计分析方法,即通过降维技术把多个变量化为几个少数主成分的方法。

主成分分析函数:

princomp(X,cor=T/F,scores=T/F····)

pc=principal(X, nfactors=2,rotate="varimax")

biplot(scores,loadings,····)

分析步骤:

1、将原始数据标准化,的标准化数据矩阵;

2、建立相关系数阵;

3、求特征值及特征向量;

4、获得主成分

5、主成分得分即载荷

6、主成分画图分析

注意事项:

1、主成分分析,最好以相关系数矩阵为主

2、为使方差达到最大,通常主成分分析是不加以转轴

3、通常将特征值小于1的成分放弃,只保留大于1的成分

4、在实际研究中,若用3-5个成分,就能解释变异80%也行

5、使用主成分,会使各变量方差为最大,且成分间彼此独立



R语言 | 主成分、因子、对应分析及R使用
R语言 | 主成分、因子、对应分析及R使用



-因子分析 -

R语言 | 主成分、因子、对应分析及R使用


用途:

减少分析变量个数

通过对变量间关系探测,将原变量进行分类

思想:

1、将相关性较高的分在同一类中,每一类代表了一个基本结构,即公因子;

2、用少数不可测的公共因子的线性函数来描述原观测的每一个分量。

样品间的因子分析称为Q型因子分析

变量间的因子分析成为R型因子分析

因子分析函数:

factanal(X,factors,scores=c("none","regression","Bartlett“),rotation="varimax")

因子载荷loadings:

市Xi与Fj的相关系数

表示Xi依赖Fj的程度

旋转目的:

寻找每个主因子的实际意义

如果每个主因子的典型代表变量不突出,就需要进行旋转

使因子载荷矩阵中再和的绝对值向0和1两个方向分化

旋转方法:

正交旋转和斜交旋转

因子分析R语言实现步骤:

一、因子计算

1、是否适合做因子分析

2、计算因子分析的对象

3、按方差贡献率定因子数

4、获得因子载荷并解释

5、是否需要进行因子旋转

二、因子评价

6、因子得分

7、因子信息图

8、综合得分

9、得分排序

R语言 | 主成分、因子、对应分析及R使用





-对应分析-




对应型关系:样品与变量间的关系→对应型因子分析

作用:

分析两组或多组因素之间关系的有效方法,在离散情况下,建立因素间的列联表来对数据进行分析。

什么情况进行对应分析:

对数据做对应分析之前,需要先了解因素间是否独立,如果因素之间相互独立,则没有必要进行对应分析。








注意问题:

1、不能用于相关关系的检验假设

2、维度由变量所含的最小类别决定

3、对极端敏感性研究

4、研究对象要有可比性

5、变量的类别应涵盖所有情况





R语言 | 主成分、因子、对应分析及R使用


R语言 | 主成分、因子、对应分析及R使用
R语言 | 主成分、因子、对应分析及R使用
R语言 | 主成分、因子、对应分析及R使用


R语言 | 主成分、因子、对应分析及R使用