信度(reliability)是测量中的一个重要概念。信度分为很多种,但所有信度的原理都相同,即:衡量一个测试的一致性与稳定性。一个测试的不同次结果之间的差异越小,信度系数越高,反之,差异大则信度低。这使得信度与相关系数(Correlation)密不可分,一些信度即是由相关系数计算而得。
Cronbach’s Alpha信度是目前应用最为广泛和最为人知的信度,一般情况下,人们所说的信度即指Cronbach’s Alpha信度(以下简称α)。在测试中,α信度低,表明考生的测试分数更多受到有问题的测试的影响,而非体现其真实能力。α信度越低,考生的测试结果与他们的真实水平的偏离(或明显偏高或明显偏低)会越大。
Cronbach’s Alpha信度的计算公式为:
α = T/(T-1) * (1 – sum(varT1, varT2 … varTX) / var(X1, X2 … XX)), (公式一)
其中,T表示测试的总题量,varT1表示所有人作答第一道题的分数的方差,X1表示第一个人作答完所有题目后的得分。
在公式一中, var(X1, X2 … XX))体现了不同的人在同一个测试中的表现差异,又可被称为个体间方差,varT体现了不同的人在同一道题中的表现差异,而sum(varT1, varT2 … varTX)则体现了整个考试的方差。
一个人的测试分数会受到其能力水平、测试本身、误差等三方面的影响,由于方差具有可加性,得:
个体间方差 = 能力方差 + 考试方差 + 误差方差
因此,公式一可转化为:
α = T/(T-1) * (1 – 考试方差 / 个体间方差),
= T/(T-1) * (能力方差 + 误差方差) / 个体间方差,
在上等式中,
(能力方差 + 误差方差) / 个体间方差的值最大为1,当为1时,表明测试具有最高的信度,不同的人在测试中的成绩差异只受到人本身的能力差异和误差因素的影响。
T/(T-1)的作用在于校正测试题量过少时,方差偏低的问题。根据不同的情况,有些研究者会将其从信度公式中删除。
通常α在0.8左右时表明该测试具有良好的信度,当低于0.6时,表明该测试信度不足。需要注意的是:信度并非越高越好。当信度超过0.95时,很可能表明该测试中存在一些多余的题目,进而降低了测试效率。
此外,在对不同的测试进行等值时,要求各个测试的信度必须相同或非常接近,信度相差很大的两个测验是不可以进行等值的。