R语言—方差分析(1)
方差分析简称ANOVA,也称“变异数分析”,用于两个及两个以上样本均数差别的显著性检验。与线性回归不同的是,自变量是因子,研究关注的重点通常会从预测转向组别间差异的分析。基本类型包括:
我们通常使用aov()函数对ANOVA模型进行拟合。表中列举了表达式中可以使用的特殊符号。其中y是因变量,字母A、B、C表示因子。
下表中是一些常见的研究设计表达式,其中小写字母表示定量变量,大写字母表示组别因子,Subject 是对被试者独有的标识变量。
表达式中效应的顺序在两种情况下会造成影响:(a)因子不止一个,并且是非平衡设计;(b)存在协变量。出现任意一种情况时,等式右边的变量都与其他的变量相关。此时,我们无法清晰的划分它们对因变量的影响。例如,对于双因素方差分析,若不同处理方式中的观测数不同,那么模型y~A*B与模型y~B*A的结果不同。
一般来说,越基础性的效应越需要放在表达式前面。具体来讲,首先是协变量,然后是主效应,接着是双因素的交互项,其次是三因素的交互项,以此类推。
下期我们将使用aov()函数对常见的实验设计进行方差分析,比如说治疗焦虑症、降低胆固醇水平、帮助怀孕小鼠生下胖宝宝、确保豚鼠的牙齿长长、促进植物呼吸、学习如何摆放货架等。我们下期见!
标签: