R语言 | 主成分、因子、对应分析及R使用
- 主成分分析 -
主成分分析,简称PCA,是将多个指标化为少数几个综合指标的一种统计分析方法,即通过降维技术把多个变量化为几个少数主成分的方法。
主成分分析函数:
princomp(X,cor=T/F,scores=T/F····)
pc=principal(X, nfactors=2,rotate="varimax")
biplot(scores,loadings,····)
分析步骤:
1、将原始数据标准化,的标准化数据矩阵;
2、建立相关系数阵;
3、求特征值及特征向量;
4、获得主成分
5、主成分得分即载荷
6、主成分画图分析
注意事项:
1、主成分分析,最好以相关系数矩阵为主
2、为使方差达到最大,通常主成分分析是不加以转轴
3、通常将特征值小于1的成分放弃,只保留大于1的成分
4、在实际研究中,若用3-5个成分,就能解释变异80%也行
5、使用主成分,会使各变量方差为最大,且成分间彼此独立
-因子分析 -
用途:
减少分析变量个数
通过对变量间关系探测,将原变量进行分类
思想:
1、将相关性较高的分在同一类中,每一类代表了一个基本结构,即公因子;
2、用少数不可测的公共因子的线性函数来描述原观测的每一个分量。
样品间的因子分析称为Q型因子分析
变量间的因子分析成为R型因子分析
因子分析函数:
factanal(X,factors,scores=c("none","regression","Bartlett“),rotation="varimax")
因子载荷loadings:
市Xi与Fj的相关系数
表示Xi依赖Fj的程度
旋转目的:
寻找每个主因子的实际意义
如果每个主因子的典型代表变量不突出,就需要进行旋转
使因子载荷矩阵中再和的绝对值向0和1两个方向分化
旋转方法:
正交旋转和斜交旋转
因子分析R语言实现步骤:
一、因子计算
1、是否适合做因子分析
2、计算因子分析的对象
3、按方差贡献率定因子数
4、获得因子载荷并解释
5、是否需要进行因子旋转
二、因子评价
6、因子得分
7、因子信息图
8、综合得分
9、得分排序
-对应分析-
对应型关系:样品与变量间的关系→对应型因子分析
作用:
分析两组或多组因素之间关系的有效方法,在离散情况下,建立因素间的列联表来对数据进行分析。
什么情况进行对应分析:
对数据做对应分析之前,需要先了解因素间是否独立,如果因素之间相互独立,则没有必要进行对应分析。
注意问题:
1、不能用于相关关系的检验假设
2、维度由变量所含的最小类别决定
3、对极端敏感性研究
4、研究对象要有可比性
5、变量的类别应涵盖所有情况