信度
信度是指测量结果的一致性、稳定性及可靠性,一般多以内部一致性来加以表示该测验信度的高低。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。反之,随机误差可能导致不致性,从而降低信度。信度可以定义为随机误差R影响测量值的程度。如果R=0,就认为测量是完全可信的,信度最高。
评介信度的方法
一般通过使用同一量表进行不同测量,分析各测量结果之间联系的方法来评价信度。如果联系密切,各测量结果具有一致性,则认为量表是可信的。评价信度的方法主要有:再预测量、替换形式、内部一致性方法。
再测信度
用同样的量表,对同一组访问对象在尽可量相同的情况下,在不同的时间进行两次测量。两次测量相距一般在两到四周之间。用两次测量结果间的相关分析或差异的显著性检验方法,可以评价量表信度的高低。结果越是相关,差异越不显著则信度越高。
用再次测量法评价信度存在一些问题。首先,结果与时间间隔关系密切。在其他方面都相同的情况下,时间间隔越长,信度越低。其次,最初的测量可能会改变被测特征。例如,测量人们对低脂肪食品的态度可能会使他们更为关心健康问题,从而对低脂食品持更为肯定的态度。第三,实施重复测量有时是不可能的,例如测量消费者对某种新产品的反应。第四,第一次测量的答案可能会对以后测量有影响。受访者可能会图回忆第一次受测时给出的答案。第五,在两次测量之间一个有利的信息可能会使受访者的态度更为有利。最后,再测信度的相关系数可能会由于被测项目自身之间的相关而偏高。两次测量中,同一项目自身之间的相关性要比不同项目间的相关性高。因此,即使不同项目之间的相关性很差,也可能得以很高的再测相关系数。
替换形式信度
用两个形式不同的等价量表,对同一组受访者在不同的时间(通常间隔两到四周)进行测量。两次测量结果间的相关性被用来评价量表的信度。
这个方法存在两个主要问题。首先,构造等价的量表不但费时,而且花钱。其次,很难构造出完全等价的量表。两个量表在内容上应该等价。从严格的意义上说,两个量表的测量项目应具有相同的均值、方差和相关性,但即使这些条件都满足了,还是有可能出现内容不等价的情况。低相关可能是量表的信度不够造成的,也可能是由于量表形式不等价而造成的。
内部一致信度
内部一致信度用于评价累加量表的信度。在这种量表中,各个测量项目的得分被累加以得到一个总分,每个项目都测量整个量表所要测量对象的某个方面,项目之间就它们各自的特征而言应该是一致的。内部一致信度强调的是组成量表的一组测量项目内部的一致性。
折半信度是测量内部一致性是简单的方法。量表中的项目被分成两半并计算测量结果的相关系数。这两半相关系数高,则说明量表内部一致性高。量表的项目可按序号的奇、性分为两半,也可以随机地合。问题在于划分两部分的方法可能会影响到评价结果。克服这一问题的常用方法是采用X系数。
X系数,也称为克朗巴哈X系数,是量表所有可能的项目划分方法的得到的折半信度系数的平均值。X系数的值在0和1之间。如果X系数不超过0.6,一般认为内部一致信度不足。X系数的一个重要特性是它们值会随着量表项目的增加而增加。因此,X系数可能由于量表中包含多余的测量项目而被人为地、不适当地提高。还有一种可以和X系数同时使用的系数。系数能够帮助评价,在计算X系数的过程中,平均数的计算是否掩盖了某些不相关的测量项目。
有些具有多个项目的量表可能在结构上是多维的,那含有几组,每一组项目测量一个方面的特征。例如,商店的形象就是一种多维的结构,包括商品的、商品的花色种类、货与保修政策、人员服务、价格、商店位置、店面局等等。用于测量商店形象的量表就要包括测量以上每个维度(方面)的测量项目。这些维度之间是比较独立的,因此,在包含各个准度的整个表内部考察一致性是不适宜的。不过,如果每个准度是由几个测量项目组成,可以计算每个度的内部一致性。
效度和信度的关系
效度和信度的关系可以用测量值的构成公式O=T+S+R来理解。如果测量是完全有效的,即0=T,S=0,R=0,此时测量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因为有O=T+R。如果量表是完全可信的,可以达到完全有效,也可能达不到,因为有可能存在导致误差,虽然缺管信度必然缺乏效度,但信度的大小并不能体现效度的大小。信度是效度的必要条件,但不是充分条件。从理论的角度来看,量应具有足够的效度和信度;从实践的观点来看,一个好的量表还应该具有实用性。实用性指量表的经济性、便利性和可解释性。