结构方程模型(2)

2019-05-17 11:24

先用探索性因子分析产生一个关于内部结构的理论，再在此基础上用验证性因子分析。但这必须用分开的数据集来做。

探索性分析步骤：

１、辨别、收集观测变量。按照实际情况收集观测变量，并对其进行观测，获得观测值。针对总体复杂性和统计基本原理的保证，通常采用抽样的方法收集数据来达到研究目的。

２、获得协方差阵（或Bravais-Pearson的相似系数矩阵）。我们所有的分析都是从原始数据的协方差阵（或相似系数矩阵）出发的，这样使我们分析得到的数据具有可比性，所以首先要根据资料数据获得变量协方差阵（或相似系数矩阵）。３、确定因子个数。有时候你有具体的假设，它决定了因子的个数；但更多的时候没有这样的假设，你仅仅希望最后的到的模型能用尽可能少的因子解释尽可能多的方差。如果你有k个变量，你最多只能提取k个因子。通过检验数据来确定最优因子个数的方法有很多，例如Kaiser准则、Scree检验。方法的选择由，具体操作时视情况而定。

４、提取因子。因子的提取方法也有多种，主要有主成分方法、不加权最小平方法、极大似然法等，我们可以根据需要选择合适的因子提取方法。其中主成分方法一种比较常用的提取因子的方法，它是用变量的线性组合中，能产生最大样品方差的那些组合（称主成分）作为公共因子来进行分析的方法。

５、因子旋转。因子载荷阵的不唯一性，使得可以对因子进行旋转。这一特征，使得因子结构可以朝我们可以合理解释的方向趋近。我们用一个正交阵右乘已经得到的因子载荷阵（由线性代数可知，一次正交变化对应坐标系的一次旋转），使旋转后的因子载荷阵结构简化。旋转的方法也有多种，如正交旋转、斜交旋转等，最常用的是方差最大化正交旋转。

６、解释因子结构。最后得到的简化的因子结构是使每个变量仅在一个公共因子上有较大载荷，而在其余公共因子上的载荷则比较小，至多是中等大小。通过这样，我们就能知道所研究的这些变量是由哪些潜在因素（也就是公共因子）影响的，其中哪些因素是起主要作用的，而哪些因素的作用较小，甚至可以不用考虑。

７、因子得分。因子分析的数学模型是将变量表示为公共因子的线性组合，由于公共因子能反映原始变量的相关关系，用公共因子代表原始变量时，有时更利于描述研究对象的特征，因而往往需要反过来将公共因子表示为变量的线性组合，即因子得分。

——【武汉杨丹《探索性因子分析与验证性因子分析比较研究》】

验证性因子分析

定义：

验证性因子分析是对社会调查数据进行的一种统计分析。它测试一个因子与想对应的测度项之间的关系是否符合研究者所设计的理论关系。

验证性因子分析 (confirmatory factor analysis) 的强项在于它允许研究者明确描述一个理论模型中的细节。因为测量误差的存在，研究者需要使用多个测度项。当使用多个测度项之后，我们就有测度项的“质量”问题，即效度检验。而效度检验就是要看一个测度项是否与其所设计的因子有显著的载荷，并与其不相干的因子没有显著的载荷。

对测度模型的检验就是验证性测度模型。对测度模型的质量检验是假设检验之前的必要步骤。

而验证性因子分析（CFA）是用来检验已知的特定结构是否按照预期的方式产生作用。 e2 e1 χ1 χ2 f1

验证性因子分析的步骤：

１、定义因子模型。包括选择因子个数和定义因子载荷。因子载荷可以事先定为0或者其它自由变化的常数。或者在一定的约束条件下变化的数（比如与另一载荷相等）。这是和探索性因子分析在分析方法上的一个重要差异，我们可以用一个直观的比喻，也就是说探索性因子分析是在一张白纸上作图，而验证性因子分析是在一张有框架的图上完善和修改。

２、收集观测值。定义了因子模型以后，我们就可以根据研究目的收集观测值了。这一点与探索性因子分析有一定的相似之处。

３、获得相关系数矩阵。与探索性因子分析一样，我们的分析都是在原始数

e3 χ3 据的相关系数矩阵基础上进行的，所以首先就要得到相关系数矩阵。实际上方差协差阵、相似系数矩阵和相关阵之间是可以相互转化的。

４、根据数据拟合模型。我们需要选择一个方法来估计自由变化的因子载荷。在多元正态的条件下，最常用的是极大似然估计，也可采用渐进分布自由估计。

５、评价模型是否恰当。这一步可以说是验证性因子分析的核心。当因子模型能够拟合数据时，因子载荷的选择要使模型暗含的相关阵与实际观测阵之间的差异最小。最好的参数被选择以后，差异量能被用来作为衡量模型与数据一致的程度。最常用的模型适应性检验是卡方拟合优度检验。原假设是模型是适应性模型，备择假设是存在显著差异。但是，这个检验受样本量大小影响，包含大样本的检验往往会导致拒绝原假设，尽管因子模型是合适的。其他的统计方法，比如用Tucker-Lewis指数，比较建议模型和“原模型”的拟合度。这些方法受样本量大小影响不大。

６、与其他模型比较。为了得到最优模型，我们需要完成这一步。如果你想比较两个模型，其中一个是另一个的缩略形式，你就能从卡方统计量的值检查出他们的差别，大约服从卡方分布。几乎所有独立因子载荷的检验能用来作为全因子模型和简因子的模型之间的比较。为以防你不是在检查全模型和简模型，你可以比较均方根误差的近似值 (RMSEA)，它是模型中每个自由度差异的一个估计值。

验证性分析适用情况

验证性因子分析要处理推论统计量，处理难度要求高。需要具备更大容量的样本。精确的样本量要随着观测值和模型的因子数变化而变化，但一个标准模型至少需要200个个体。在进行分析过程中必须选择与每个因子在很大程度上匹配的变量，而不是可能是潜在变量的“随机样本”。 —— 【杨丹，《探索性因子分析与验证性因子分析比较研究》】

信度检验

定义：

信度（reliability）是指测验结果的一致性、稳定性及可靠性，一般多以内部一致性来加以表示该测验信度的高低。

信度检验是指同一个测验对同一组被试验测两次或三次，对所得结果一致性程度进行检验。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响，因为系统误差总是以相同的方式影响测量值的，因此不会造成不一致性。反之，随机误差可能导致不致性，从而降低信度。信度可以定义为随机误差R影响测量值的程度。如果R=0，就认为测量是完全可信的，信度最高。

方法：（注：该部分内容基本是直接引用，当中有其他文献的内容穿插。在使用时请适当修改。）（ 1 ）再测法 : 用同一测验对同一被试 , 前后施测两次 , 根据两次测验分数计算相关系数 , 即是再测信度。该信度反映了测验的稳定性程度 , 故又称稳定性系数 , 是用皮尔逊积差相关公式计算的。用再测法估计信度 , 可以得到有关测验结果是否随时间而变化及变化程度的资料 , 可以作为预测被测者将来行为表现的依据。但也存在明显的局限性 : 前后两次测验结果易受到练习和记忆的影响 , 前后两次施测的时间间隔影响稳定性系数 , 特别是对学绩测验的影响较大。如果时间间隔太长 , 被测者的身心因受环境影响将发生大的变化 , 从而对第二次施测结果产生较大影响 , 使稳定性系数降低 ; 如果间隔太短 , 则被试第一次完成测验时练习和记忆会对第二次测验产生较大影响 , 使第二次测验性质发生变化。另外 , 有些测验不宜用再测法估计信度 , 如测量创造力测验 , 被试一旦掌握了解决问题的办法、原则 , 重测时 , 他将很容易作出反应 , 这样测验的性质就发生了改变。因此 , 只有在没有复本可用 , 测验不易受重复使用影响 , 现实条件又允许重复施测的情况下才使用重测法估计信度。

用重测法估计信度 , 间隔时间长短没有严格的规定 , 一般说 , 间隔时间越长 , 稳定性系数越低 , 最适宜的时距应根据测验目的、性质及被试特点而定 , 最好不超过六个月。对儿童的时距应该短些 , 对成年人的时距可适当长些 , 因为个体早期的身心特征变化较大 , 而成年人的身心特征则相对稳定。

（ 2 ）复本法 . 根据同一测验目的编制的许多平行德等值测验 , 可测定被试的同一特征 , 这些等值的测验叫做复本。对一组受测者间隔一定时间或同时施测两个复本 , 根据两次测验结果求得相关系数 , 即得等值性系数 , 又称复本信度。对一组受测者间隔一定时间后施测两个复本所求得的稳定性系数又称等值稳定性系数。因为用这种方法求得的信度不仅受复本质量的影响 , 而且受时间练习等因素的影响 , 因此 , 等值稳定性系数更全面地反映了测验的信度。计算等值稳定性系数是对两个复本测验结果计算斯皮尔曼积差相关系数 ( 具体公式见前 ) 。

（ 3 ）分半法 . 当测验没有复本 ( 复本的编制是很复杂的 ) 而且测验只适合施测一次的情况下 , 可用分半法估计信度 , 即将测验题目分成对等的两半 , 根据每人在这两半测验中的得分 , 计算其相关系数 , 这个系数又称内部一致性系数。

要求得分半信度 , 首先要将测验分成对等的两半。绝大多数测验是由许多题目排列组成的 , 但是若将测验简单地分成前后两部分 , 常常是不对等的 , 对等的两部分起码有两个要求 : 一是测验的两部分在难度、区分度及测验目标上基本是相同的 ; 一是被测者以同等的态度来对待两部队测验 , 即在完成两部分测验过程中 , 练习 , 疲劳 , 情绪等因素对被试产生了同等的影响。因此 , 将一个测验分成两部分时 , 常用的是奇偶分半法 , 即将奇数题分为一部分 , 将偶数题分为一部分。特别是测验题目是按由易到难排列时 , 这种分法可以将测验分为大致相等的两半 , 但是 , 对于速度型的测验不适合用奇偶分半法。用分半法求出的测验的信度系数并不能反映整个测验的信度。这是因为信度受测验的长度的影响 , 测验越长 , 信度越高 , 将测验分成两半求得的信度系数 , 低估了整个测验的信度 , 因此 , 需对测验系数加以校正 , 校正公式是斯皮尔曼—布朗 (Spearman — Brown) 公式。指标：

大部分情况下，信度是以信度系数为指标，它是一种相关系数。

常常是同一被试样本所得到的两组资料的相关，理论上说就是真分数方差与实得分数方差的比值，公式为：

r(xx)=r^2(xt)=S^2(t)/S^2（x）

公式中r^2(xt)是真分数标准差与实得分数标准差的比值，称作信度系数，公式为： r(xt)=S(t)/S(x)

可见信度指数的平方就是信度系数。

信度指标：包括重测信度、分半信度和克朗巴赫系数

（1）重测信度是相同量表前后两次测量同一批被访者量表得分的简单相关系数r，一般要求达到0.7以上。

（2）分半信度是相同量表的调查项目分成两半，如分前后两个部分、按提问项目号的奇数和偶数分两个部分。计算两个部分得分的简单相关系数r，分半信度为R＝2r÷（1＋r）。（3）克朗巴赫系数你已经算得了，就不赘述了。

共3页:

结构方程模型(2).doc 将本文的Word文档下载到电脑下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档