数字,因此一般都是将估计好的「同因素变方」适当地放在这样的对角线各点。这样,如果使用者想要用到利用「同因素变方」的因素分析时,他就可以有所选择。
Statistica将「估计相关的同因素变方」及「萃取因素」的方法,综合为几个选项,说明如下。 1.主成分法
此法维持相关系数矩阵的对角线各项为1。这是Statistica软件default的方式。以下第2-6法都考虑到「同因素变方」的置入。其中有些的计算不止是相当困难,而且解释也并不易明白。下面我们将尽量试着解释,并给一些相关参考数据。但我们要说的是,因素分析是「结果导向」的,你的首要任务是先设法求出你可以解释的因素结构。至于选「萃取因素」和「求同因素变方」的不同方法,则是技术问题。至于这些方法里面的细节计算和道理,是更技术的技术问题。下面的方法,是选单上的方法。因为太过专门,我们就不翻译它们的名称了。
2.「Communalities= multiple R-square」法
以
对
做回归,得一个对
值。我们就将它当作相当于做回归,得到另一个
的
「同因素变方」。以就将它当作相当于
值。我们
的「同因素变方」。以此类推。若选取此法,则在
。
取因素之前,相关系数矩阵的对角线各项,就分别代入这样求得的
3.「Iterated communalities (MINRES)」法
此法一开始用2的做法,然后再反复计算多次(iteration),是一种以某
种适合度检定(goodness of fit)为准则的方法。
4.「Maximum likelihood factors」法
此法要先假设m(因素的个数)为已知(选取于「maximum number of
factors」的地方),然后再用「最大概度估许法(MLE)」来估算。见 Harman
(1976)。
5.「Centroid method」法
这是一个1931年就有的老方法。我们猜想,这大概只是Statistica对传
统的尊重吧。见 Harman (1976)或者 Wherry (1984)。
6.「Principal axis method」法
此法极为麻烦,主要是将「特征值(eigen value)」和「同因素变方」一再反复计算到某一程度为止。
之所以有这样多种方法,主要是因为「没有一种完全令人满意」。在这里,反正计算机算得快,你只有一个一个试到你满意为止。很多时候,它们计算的结果都相差不多,因此你也实在没有甚么好挑。
因素分析的另一个问题是,因素并不是唯一的。例如若是已求得我们便有(不妨假设p=4)
(2.3)
若令
则可反解出
而在代入(2.3)之后,则原来的示。因此(
)这一组因素和(
便可立刻用另外的新因素
)这一组因素,其实并无不同。
来表两个因素,
我们要选那一组?其实主要是看有没有解释。这里的方法,是「转轴」的变换。普通是一对因素中先互转,再试另外一对。比如先试一下
,然后再试一下
等等。这里面,学者们发展了一些可能比较会成功的转轴方法,Statistica提供了八种。
这些方法,有时有理,有时无理。因此可能给你不同的答案。但这也是你用判断的时候。这里所谓的判断,并不是要你去判断「那一种转轴方法比较好」,反而是让你「由所得的结果来判断」。因素分析是无所谓「唯一解」的。因为问题本身的架构就告诉我们它有无穷组解。我们在此就不一一解释这些转轴的方法了。因为我们是假设你即使不懂,也应该去试的。
第四节 因素转轴的方法
转轴的原则旨在能符合Thurstone (1947)的「简单结构 (simple structure)」,亦即在于使经过转轴后的因素矩阵中每一个变量都只归于一个或少数几个因素上,使矩阵中零或接近于零的因素负荷量增多,以减低因素的复杂性,使因素的解释由繁杂趋向简单,Statistica通常所用的正交转轴的方法有四种: 1. Varimax 2. Biquartimax 3. Quartimax 4. Equamax
而每种都分为「raw」和「normalized」两种变化,因此一共有八个选择。至于它们是甚么意思,我们就不多说了。见 Overall and Klett (1972),或者 Rummel (1970)。
第五节 Statistica 中之因素分析的例子
以十名游泳选手为受试者,就「气力」、「耐力」、「速度」和「协调」四方面观察,所得测验成绩如下。试分析这四项体能的共同因素。
由STATISTICA Module Switcher选择「Factor Analysis」,进行因素分析法。(如图2-2)
以下为十名游泳选手为受试者,就「气力」、「耐力」、「速度」和「协调」四方面观察,所得之测验成绩如下图2-3。(选择 factor.sta 档案)。
进入因素分析的窗口中,有变量「Variables」,输入数据形态「Input file」和遗失值的处理「MD deletion」三项。其中「Input file」有两种类型:RawData 和 Correlation Matrix。而「MD deletion」有三种类型:Casewise,Pairwise MD Deletion 和 Mean Substitution。
选择「Variables」时,将这四个变量通通选入。因原始资料为测验
图2-2
图2-3
成绩,而非矩阵,故在选定「Input file」为Raw Data,且「MD deletion」为 Casewise后进行分析。在图2-4中按「OK」后进入图2-5,图2-5为
图2-4
图2-5
定义萃取因素的方法窗口,上面的白色框框为之前的定义,下面可分为三 部份「Review corrs/means/SD」,「Perform multiple regression」,和「Extraction method」。其中「Review Corrs/means/SD」为基本统计量的描述,按下此钮可进入图2-6之窗口,由图可知,可求得平均数、标准差、相关系数、共变异数、各种的统计图表、更提供了二维以上的图表供使用者操作,先初步了解数据的特性。