在IRT分析中,难度参数(Difficulty Parameter,𝛿)、位置参数(Category Parameter,𝛿𝑘),步骤参数(Step Parameter,𝜏𝑘)、阈值(Thurstonian Threshold,γ)是四个容易混淆的参数值,因为在不同的情形下,研究者们会选择采用它们中的一个或多个来作为项目难度值(Item Difficulty),本文将对比这些参数的异同。
在使用分部评分模型(Partial Credit Model,PCM)进行分析时,对0,1,2计分的题目来说,关系如下图:
在使用专业软件进行分析后,根据上图的结果反馈通常如下:
步骤参数1 (𝜏1) 会用Step1 表示,步骤参数2 (𝜏2) 会用Step2 表示。
有些软件对0,1,2计分的题目仅反馈Step1,因为,Step1 = – Step2。
对0,1,2,3计分的题目仅反馈Step1和Step2,因为,Step1 + Step2 = – Step3。
位置参数1 (𝛿1) 通常用Cat1 表示,位置参数2 (𝛿2) 会用Cat2 表示,题目的难度参数 (𝛿) 会用Item_D 表示,Item_D为0分概率曲线与2分概率曲线的交点值。
对0,1,2计分的题目来说:Cat1 = Item_D + Step1, Cat2 = Item_D + Step2。
下图为一个0,1,2,3,4计分题目的累积概率曲线图,
对于0,1,2,3,4计分的题目来说,分析结果有4个步骤参数 (𝜏𝑘),其中,
Step1 + Step2 + Step3 = – Step4;
有4个位置参数值 (𝛿k) ,其中,Cat4 = Item_D + Step4
题目难度(Item_D)为0分概率曲线与4分概率曲线的交点值。
依照上图,0,1,2,3,4计分的题目还有4个阈值(Thurstonian Threshold,γ),其中,γ1 = -0.68,意思是,考生的能力为-0.68时,作答该题有50%的概率可以得到1分…,γ4 = 0.72的意思是,考生能力为0.72时,作答该题有50%的概率可以得到4分(即满分)。
对于0,1计分的题目来说,
阈值(γ, 又thresh1) = 难度参数(𝛿, 又Item_D) = 位置参数(𝛿𝑘, 又Cat1),
步骤参数(𝜏, 又step) = 0。
综上所述,当对0,1计分的题目进行分析时,研究者们认识统一,即将测试者得到1分的概率正好达到0.5时的能力值作为该题目的难度值。
然而,对于多级计分的题目(Polytomous item)来说,有些研究者偏向将0分概率曲线与4分概率曲线的交点值作为题目的难度值,并将位置参数(𝛿𝑘)作为各个评分类别的难度值;另一些研究者则将题目满分的阈值(γ)作为题目难度值,将各个评分类别的阈值(γ)作为各个评分类别的难度值。
必须要注意的是:各个评分类别的概率曲线会随着项目(item)和样本(person)的变化而变化,而基于不稳定的概率曲线的交点与距离确定的位置参数(𝛿𝑘)值和步骤参数(𝜏𝑘)值同样也是不稳定的。基于此,使用瑟斯顿阈值(Thurstonian Thresholds)作为项目难度会是更好的选择。