该模型自1992年问世以来,得到了不断发展和修正,并在模型中纳入了一些新元素,比如,ECSI(欧洲满意度指数模型)中引入了品牌形象作为影响总体满意度的一个变量,而在《中国顾客满意度指数指南》一书中同样引入“品牌形象”作为一些行业满意度测评的变量。
自CSI模型提出以来,偏最小二乘回归(PLS,Partial Least Squares)就被作为对模型中潜变量(Latent Variable)进行估计最主要的方法。但是偏最小二乘回归在应用中存在一些先天的不足和缺陷,主要是:
1、 虽然它能通过观测变量对潜变量作出很好的预测,但是对于观测变量测量误差的预测则 存在偏误;
2、当因子在理论上存在相关时,偏最小二乘回归不能准确的揭示因子间的这种关系,而且 因载荷也可能被过度估计;
3、 最小二乘回归模型中,潜变量的得分是在指标信度估计和潜变量回归方程的决定系数 (R2)最大化的基础上获得的,这种方法会导致部分参数(误差方程)最小化。
作为潜变量估计的另一种方法:结构方程模型(SEM,Structural Equation Modeling),由K.Jorekog于1973年提出,在过去三十多年里不断得到发展,20世纪90年代被广泛应用于社会科学领域。与偏最小二乘回归相比,结构方程不仅克服了偏最小二乘回归的缺点,同时还具有以下优势:
1. 结构方程模型能够对模型中的省略变量,如误差协方差,进行显著性检验;
2. 结构方程对于模型的设定具有更大的弹性;
3.结构方程模型能够同时在多个群体中对同一模型进行估计;
4.在结构方程模型中,研究人员可以限定参数等于某个特定的值或者作为其他参数的线性/非线性函数;
5. 结构方程模型中可以包含定序(Ordinal)甚至分类变量(Categorical),而PLS则假定变量为定距变量;
6. 结构方程模型可以对缺失数据进行最大似然估计,而PLS则要求数据是完整的数据集,若数据不完整则需要通过回归、均值替代、列表状态删除等方法对缺失值进行处理。
鉴于以上一些因素,近年来结构方程模型逐渐取代最小二乘回归在满意度研究中得到应用。本文将对结构方程模型的基本概念及步骤进行介绍,并通过该方法在移动通信满意度研究中欧宝直播ob6[2] 对模型使用过程的问题及结果进行解释,权当抛砖引玉。
二、 结构方程模型的基本概念
结构方程模型是通过观测变量集合的间的协方差结构和相关结构出发,从定量的角度建立模型来研究变量的间因果关系的一种方法,它包含了回归分析、因子分析、路径分析和多元方差分析等多元分析技术。要应用结构方程模型,必须先熟悉模型的一些基本概念。
2.1 潜变量(Latent Variable)与观测变量(Observed Variable)
在社会科学中,研究者常常会关注一些不能直接测量的理论结构或者变量,比如社会地位、声望等,这些比较抽象的现象或者概念,在结构方程模型中被成为潜变量。在满意度研究中,诸如总体满意度、忠诚度等,常作为潜变量。由于潜变量不能直接测量,所以研究者需要设计一系列可以反映其特征或属性的行为变量进行测量,如为了对于客户忠诚度,研究者常通过“是否继续使用”、“是否会向别人推荐”等行为变量监测客户的忠诚度。这些可以直接进行测量的变量“是否继续使用”、“是否会向别人推荐”等即是观测变量。在市场研究中,收入,教育等变量也属于观测变量的范畴。
2.2 内生变量(Endogenous Variable)与外生变量(Exogenous Variable)
在结构方程模型中,潜在变量分为外生潜变量和内生潜在变量,所谓外生潜变量,相当于自变量,它们会引起模型中其他潜变量的变化,而它们的变化是由模型之外的其他因素决定的,如测量误差即属于此类变量。通常影响外生变量的因素包括性别、社会经济状况等。内生潜变量相当于因变量它们常常直接或间接受到外生变量或其他变量解释影响,也即内生潜变量值的变化通常都能被模型解释。总体满意度、忠诚度通常都属于内生潜变量。此外,在结构方程模型中,观测变量均属于内生变量。
三、结构方程模型的一般形式
3.1 数学模型
结构方程模型由测量模型和结构模型两部分构成。
1)对于潜在变量之间的关系(如:总体满意度与忠诚度),即结构模型部分,其矩阵表达式如下:
η=βη+Γξ+ζ
3、η—内生潜变量
ξ—外生潜变量
β—内生潜变量的关系
г—外生潜变量对内生潜变量的影响
ζ—模型内未能解释部份(即模式内所包含的变量及变量间关系所未能解释部分)
2)对于外生变量与潜变量间的关系,即测量模式部分:
X=Λxξ+δ
Y=Λyη+ε
X,Y是外生及内生变量。δ,ε是X,Y测量上的误差。
Λx是X指标与ξ潜变量的关系。Λy是Y指标与η潜变量的关系。
3.2 路径图
结构方程模型可以路径图进行展示。通常,在路径图中,圆或者椭圆表示潜变量,矩阵表示观测变量,单向箭头表示一个变量对另一个变量的影响,双箭头表示变量间的协方差或者相关。因此一个完整路径图通常需要展示以下四个方面的内容:
观测变量对潜变量的回归系数;
潜变量之间的回归系数;
与观测变量相关的测量误差;
潜变量预测值的残差。
下面以本文将采用的欧宝直播ob6来展示结构方程模型的路径图及其构成:
图2:某通信业务客户满意度之结构方程路径图
图2中总体满意度与广告宣传、促销等变量构成的模型以及忠诚度与转网、推荐等四个变量构成模型都属于测量模型。而总体满意度与忠诚度构成的模型则属于结构模型。
四、 结构方程模型的步骤[1]
一般而言,结构方程模型的应用可以包括以下步骤:(1)基础理论模型的设定;(2)构造因果关系路径图;(3)模型的估计与识别;(4)模型拟合优度评价;(5)模型修正。下面我们将对这五个步骤分别进行说明。
4.1 设定基础理论模型
由于结构方程模型是一种证实性的建模技术,在因果模型中变量之间存在的直接或者间接的关系并不是由模型去发掘的,模型(如图2)的设定通常都有一定的理论支持,或者有一些已经在过往研究中得到的经验性结论作为基础。因此,在进行模型验证之前,研究者必须对于变量之间的关系进行设定。
在模型设定过程中,研究者必须考虑模型验证的可操作性,在模型中不应存在过多的变量,因为变量的多寡会直接影响软件的运算过程,此外,变量过多亦会对变量间关系的识别造成难度。笔者曾对多达48个的观测变量,11个潜在变量的模型进行验证,致使AMOS运算时间高达20多分钟,结果模型还不可识别。因此在建模前,需要对于变量及因素(潜变量)进行仔细的甄选。
4.2 构造因果关系路径图
不必赘言,将理论模型转化为路径图即可(如图2),需要注意的是,在路径图完成后,我们需要对于部分观测变量与潜变量之间的回归路径系数进行设定,通常我们会设定某个路径系数值为“1”,其意义相当于假定潜变量与观测变量的测量测度一致,即如果观测变量为定距变量,潜变量亦为定距变量。
4.3 模型的估计与识别
结构方程模型是在观测变量的方差协方差矩阵或者相关矩阵的基础上对模型进行拟合的,不过AMOS软件可以接受单个样本构成的原始数据,但在拟合过程中仍需要对原始数据进行转换。由于结构方程模型的前提假设是数据符合多元正态分布,且变量间的关系是线性的,因此在模型拟合之前应对数据中奇异值的进行诊断。若需要输出模型的修正指数,还需要提前对数据中的缺失值进行处理,否则AMOS不能输出该结果。
在结构方程模型的使用过程中,我们需要关注的另一个问题就是模型的识别问题(Model Identification),这也是我们在实际应用中会经常碰到的问题。当模型不可识别时,AMOS软件不会给出模型的参数拟合值,但会在输出文本中表示哪些变量是不可识别的(unidentified),一般而言,任何参数不可识别也意味着模型不可识别。因此,广义上讲,模型识别的核心在于是否模型中的所有参数均能通过观测数据求得唯一解。
结构方程模型的识别可分为恰好识别(just-identified)、过度识别(over-identified)和不可识别(underidentified)。当模型中的数据的方差和协方差数量等于待估参数的数量时,为恰好识别模型。虽然恰好识别模型能够求得所有参数的唯一解,但是由于该模型自由度为0,才导致其不被否定,因此,此类模型并不被采用。当模型中的待估参数数量少于数据的方差与协方差数量时,该模型为过度识别模型。此类模型也是结构方程模型应用中所重点关注的。当模型中的数据的方差和协方差数量小于待估参数的数量时,为不可识别模型。在结构方程模型的使用过程中,我们可以通多预先设定减少自由参数,拟合简约模型(parsimonious model)。遇到模型不可识别时,可以通过固定潜在变量方差的测量误差,或者固定已知的部分变量间的路径系数,也可考虑删除部分变量。为了减少处理结果的误差,可以通过因子分析或者相关分析等,对变量间的关系进行确认和修正。
4.4 模型拟合优度评价
经过三四十年的发展,统计学家对于结构方程模型的拟合提出了数十种指标,各种指标各有优劣,本文仅对AMOS软件中输出结果中较具参考价值的指标进行说明。
X2拟合优度检验(X2 goodness-of-fit test):属于模型的绝对拟合指数,但是由于该指数有样本量影响较大,当样本容量很小时,容易接受劣势模型;样本容量大时,容易拒绝所有拟合很好的模型。因此该指标通常不用作对于单个模型的拟合评价指标,但需要对于多个模型进行比较验证时,如比较同一模型对于在不同情况下对不同群体的拟合是否存在差异,则是重要的参考指标。
比较拟合指数CFI:属于相对拟合指数。由于使用不同的方法对模型进行拟合时,CFI值较为稳健,甚至在对小样本模型拟合或对嵌套模型比较时也有较好的效果,因此CFI是具有非常好的参考价值。一般当CFI>0.90时,即认为模型拟合较好,但Bentler等在1999年对参考值进行修正,认为当CFI>0.95时,模型对数据拟合才非常好。
Tucker-Lewis指数TLI:属于相对拟合指数。在样本量较大时,该指数具有较好的参考价值,一般认为当TLI>0.95时,模型拟合较好。
近似误差的均方根RMSEA:属于绝对拟合指数。当RMSEA<0.05时,或者在90%的置信度下,其置信区间上限小于0.08时,表示模型拟合较好。
4.5 模型修正
模型的修正是对于最初的理论假设模型中存在的缺陷和不足进行改进,已获取更具价值的模型。通常,我们可以通过考察模型的残差矩阵和模型修正指数(MIs)获取相关信息,尤其是修正指数。但是由于AMOS只能对完整的数据集才能给出残差矩阵和修正指数,因此,在必要的情况下,研究者可以预先对于数据中的残差进行处理。
[1] 关于结构方程模型步骤的详细说明,读者可以参考柯惠新、祝建华、孙江华《传播统计学》相关内容。
五、 结构方程模型在电信客户满意度研究中的应用
本节所涉及的欧宝直播ob6为移动通信业务满意度研究,国外一些学者在对满意度指数模型进行大量实践表明,客户期望对于总体满意度的影响力相对较小,甚至可以忽略。因此,在初始模型设定时,未将客户对于各指标的期望纳入模型。模型的雏形见图2。AMOS软件使用过程中,为了使模型的设定更加方便,各观测变量均以相应题号代替。AMOS软件中的初始路径图如下:
图3:AMOS软件中的初始路径图
完成模型设定后,对模型进行拟合。在自由度为97的情况下X2(CMIN)为1113.970,P值小于0.05。由于样本量较大,因此我们特别关注TLI值,TLI=0.976,大于0.95的参考值。CFI=0.982,亦大于0.90的参考值。从这两个指数看来,模型的拟合效果似乎很好。但是,我们发现RMSEA值为0.076,大于0.05,此外,在置信度为90%时,其上限值达到0.08,这说明模型的拟合仍存在一定问题。
通过对模型的输出结果进行检查,我们发现f1(市内资费)和f2(国内资费)两个变量对于忠诚度路径系数的C.R.值分别为0.258和0.997,小于1.96,未通过显著性检验。于是我们从模型中删除这两个变量。由于原始数据中存在缺失值,估AMOS无法输出残差矩阵和模型修正指数。于是我们在SPSS中对于进行双变量的相关分析,发现q2与q3,q2与q4,q3和q4,q6与q4,q8与q4,以及q7和q8之间的存在显著相关。于是对模型进行修正,结果如图4。
图4:修正后的模型路径图
在AMOS中对修正模型重新进行拟合,TLI=0.992,大于0.95的参考值。CFI=0.994,亦大于0.90的参考值。TLI和CFI值与初始模型相比,有一定提高。而RMSEA值为0.049,比初始模型减小约0.027,小于0.05参考值,此外,在置信度为90%时,其上限值达到0.054,小于0.08。说明修正后模型对样本数据的拟合效果较好,可以接受其为最终模型。虽然模型仍有进一步修正的可能,但进一步亦可能会导致模型的拟合效果更差,因此,一般情况下,当模型的关键拟合指标达到要求后,就不必再对模型进行修正。
图5:修正模型的标准化估计结果
MOS可以同时输出模型的非标准化结果和标准化结果,其意义与回归方程中的非标准化系数和标准化系数意义类似,此处仅对标准输出结果进行解释。图5为模型的标准化结果。
表1:修正模型标准化系数
标准化系数的大小反应了一个指标对另一个指标影响力的大小,本例中13个观测变量中,客户服务(客服电话和营业厅)的相关指标对总体满意度均有较大影响,这与该业务在当时刚开始推广有一定关系,因为用户对业务的咨询较多,故接触这两个环节频率相对较高,因而对于服务的质量感知较为敏感。此外,资费也是影响用户总体满意度的重要因素。广告促销对于总体满意度的影响力比较小。
标准化系数在研究中又被称为推导重要性,它反映了用户行为的真正驱动力,因而标准化系数也常用于满意度提升矩阵,为满意度改进指明方向。
由于本例涉及的指标不够完善,因此在结果的解释上存在一定局限,如果在模型中加入可承受的溢价等指标,则可对满意度对企业经营绩效的影响进行分析;如果加入客户的消费量及相关背景指标,亦可为企业发掘高价值客户提供参考依据。
在市场研究中,结构方程模型除了用于满意度研究外,还可用于消费行为,甚至市场细分等领域。读者若有兴趣,不妨尝试。此外,本文在撰写过程中可能存在一些纰漏,欢迎各位斧正。
参考文献:
1.Barbara M. Byrne (2001). Structural Equation Modeling With Amos: Basic Concepts, Applications and Programming
2.B.S.Everitt (1984).Introduction to Latent Variable Models
3.D.J.Bartholomew and M.Knott (1999). Latent Variable Models and Factor Analysis
4.Christina O’Loughlin and Germa Coenders (2002). Application of European Customer Satisfaction Index to Postal Services. Structural Equation Models versus Partial Least Squares
5.Scott,MacLean Kevin and Gray(1998. Structural Equation Modeling in Market Research, Journal of the Australian Market Research Society.
6.侯杰泰、成子娟(1999)。结构方程模型的应用及分析策略,心理学探新,69,54-59。
7.柯惠新、祝建华、孙江华(2003)。传播统计学,370-390。
8.唐晓芬(2001)。顾客满意度测评。