结构方程式模型假定在一组潜在变量中存在因果关系,这些潜在变量可以分别用一组可观测的变量表示。假设的模型通常包括某个基本线性回归模型和很多观测变量,而这个基本的线性回归模型应该是一组潜在变量的结构关系模型。这一组潜在变量分别是那些观测变量中的某几个的线性组合。在技术上,通过验证观测变量之间的协方差,可以估计出这个基本线性回归模型的系数值,从而在统计上检验所假设的模型对所研究的过程是否合适,也就是检验观测变量的方差协方差矩阵与模型拟合后的引申方差协方差矩阵的拟和程度,如果证实所假设的模型合适,就可以得出结论:我们所假设的潜在变量之间的关系是合理的。
结构方程式的基本概念
一般采用路径图(pathdiagram)的形式表示结构方程式模型,这是最简单、最直观的描述模型的方法,研究人员可以借助路径图直接和明了地将变量之间的关系以图形的方式表现出来。流行的AMOS软件可以直接利用路径图的模型设定进行分析,并将分析结果直接标识在图中。习惯上,在路径图中潜在变量用椭圆型表示,观测变量用矩形表示;如果两个潜在变量之间有相互关系,用双箭头联结这两个潜在变量;如果两个潜在变量是因果关系,则用单箭头联结这两个潜在变量,箭头指向结果变量。如果一个潜在变量可由若干观测变量表示,这个潜在变量被看作观测变量的因子(factor),用单箭头联结这个潜在变量与观测变量,箭头指向观测变量,表示潜在变量直接影响了观测变量的值。在因果关系模型中,影响其它变量而其自身的变化又假定是由因果关系模型外部的其它因素所决定的变量称之为外生变量(exogenousvariable),由外生变量和其它变量解释的变量称为内生变量(endogenousvariable)。
在SEM中,所假设的潜在变量之间的关系模型,是一种关于传播理论的临时的基本模型,我们称之为结构模型(structuralmodel);而那些在统计显著的观测变量与测量的潜在变量之间的线性关系模型,称之为度量模型(measurementmodel)。结构模型实际上是某种意义上的回归模型,要做的工作是验证这个模型是否合适,也就变成了估计潜在变量之间相应的回归系数(路径系数)的值,而度量模型便是估计这些回归系数的依据。
结构方程式模型的评价
结构方程是模型的目标就是再生一个观测变量的引申方差协方差矩阵Σ,使之与样本方差协方差矩阵S尽可能地接近,同时评价模型对数据的拟合程度。如果引申的方差协方差矩阵Σ与样本方差协方差矩阵S之间的差别非常小,也就是残差矩阵各个元素接近于0,就可以认为模型拟合了数据。
关于模型的总体拟合程度有许多测量指标和标准,对模型的评价,涉及到模型对数据的总的拟合程度,AMOS软件提供了多种判定拟合优度的量。用户可以在模型上面直接给出拟合统计量,显示统计量结果。
①卡方统计量(X2)
最常用的拟合指标是拟合优度的卡方检验(X2-goodness-of-fittest)统计量。在最大似然估计ML、一般最小二乘法GLS和广义加权最小二乘法ADF下,卡方值X2等于样本量减1乘以拟合函数的最小值。
在观测变量服从多元正态分布且模型设定正确的话,如果分析方差协方差矩阵,则乘积服从卡方分布(或渐进服从卡方平方分布)。这里需注意,它的检验正好与传统的统计研究相反,我们希望得到的不显著的卡方值,大的值对应差的拟合,小的值对应于好的拟合。事实上,这里的卡方检验是“拟合劣度(badness-of-fit)”检验,很小的卡方值说明模型拟合很好。但是,卡方检验统计量与样本量的大小密切相关,当样本量越大,卡方值也越大,拒绝一个模型的概率就会随着样本量的增加而增加,也就是说,最好把卡方检验看成是度量拟合优度的量,而不是把它当作检验统计量。为减小样本量对拟合检验的影响,习惯上采用卡方值与自由度之比,如果比值小于2,则可以认为模型拟合较好。
②拟合优度指数(GFI)
拟合优度指数(goodness-of-fitindex)GFI度量了观测变量的方差协方差矩阵S在多大程度上被模型引申的方差协方差矩阵所预测,如果Σ=S,GFI=1,意味着模型完美拟合。
③修正的拟合优度指数(AGFI)
修正的拟合优度指数(adjustedgoodness-of-fitindex)AGFI利用模型中参数估计的总数与模型估计的独立参数—自由度来修正,估计的参数相对于数据点越小,AGFI越接近GFI。 以上两个指数都在0和1之间,较大的数对应于较好的拟合,一般大于0.9时,则认为模型拟合观测数据。与X2不同的是,GFI和AGFI不是样本容量的函数,因为它们并不是统计量,只是测量了样本方差中估计方差所占的加权比例,因此不能用来对模型的拟合优度进行统计检验。
④平方平均残差的平方根(RMR)
平方平均残差的平方根(rootmeansquareresidual)RMR度量了拟合残差的一种平均值,说明样本方差和协方差在假定模型正确的情况下的估计值的差异,RMR越小,说明拟合较好,如果RMR等于0,表明模型完美拟合。
⑤本特勒-波内特规范指数(NFI)
本特勒-波内特规范指数(Bentler-Bonettnormedfixindex)是从设定模型的拟合(或是拟合函数,或用卡方值)与独立模型(independencemodel)的拟合之间的比较。独立模型是指假设所有变量之间没有相关关系,也就是说,模型中所有的路径系数和外生变量之间都固定为0,只估计方差。用来比较设定模型与独立模型在拟合上的改善程度。
⑥近似误差的平方根(RMSEA)
近似误差的平方根(rootmeansquareerrorofapproximation)。习惯上,RMSEA取值小于0.05,表明相对于自由度模型拟合了数据;另外,建议在90%的置信度下,如果RMSEA取值小于0.08,则可认为近似误差是合理的,或者说在置信水平0.01下不能拒绝这一假设。RMSEA评价指标近年来越来越受到重视。
⑦信息标准指数(informationcriteriaindex)
信息标准测量是为了作不同模型的比较,信息标准测量的值越小说明含独立估计参数越少的模型拟合越好,也就是说简约模型(parsimoniousmodel)越好。一般在设定的理论模型中,使用同一数据,按照理论减少模型中某个或某几个自由参数,比较某种信息标准指数的差异,选择指数最小的模型,也就是简约模型。
需要强调的是,虽然这里给出了许多评价模型拟合指数,但是没有唯一的模型拟合标准指数是正确的。所以,在模型拟合过程中,要尽量纳入各种指标,并尽可能地了解各种指数的内在含义,这可能完全需要研究者来判断。
实际应用中,研究者还需要对度量模型和结构模型的可靠性和有效性进行必要的检验,一般可根据经典的检验理论,采用复相关系数和总决定系数说明单个观测变量或全部观测变量作为潜在变量的度量指标的可靠程度,以及单个或全部外生潜在变量对内生潜在变量的方差效应。
此外,模型及拟合的标准并不完全是统计问题,即使一个模型拟合了数据,也不意味着这个模型是“正确的”或是“最好的”。因为可能存在着等价模型(equivalentmodels),竞争模型(competingmodels)。如果简单模型的拟合与复杂模型的拟合一样好,就应该接受简单模型,因为,我们的目标就是建立简约模型,也就是说模型中的参数越少越好。因此,结构方程式模型的模型策略简单就是美,最重要的是所有估计参数应该有实际意义,能够得到合理的解释,研究者始终应该将结构方程式模型建立在有说服力的理论假设上。