两参数 IRT 模型中的区分参数是否仅特定于项目?

机器算法验证 心理测量学 项目反应理论
2022-04-16 06:51:33

来自IRT的两参数模型中的判别参数通常被认为是项目参数。

但我开始怀疑它了。想想心理物理学;例如,检测亮度。我认为没有人会说歧视(即斜率)参数适用于亮度本身。它来自人类的感知,所以我认为这是一个人的参数,每个人可能会有所不同。

测试情况如何?毫无疑问,歧视参数被认为是一个项目参数?我对此表示怀疑,尤其是考虑到差异项目功能( DIF )存在空间这一事实

所以我担心有任何理论基础可以说歧视参数是项目参数。

我想我可以建模个人歧视参数模型,其中项目歧视参数由组中的个人歧视参数确定。这将证明 DIF 是合理的。

所以,我的问题总结如下:

  1. 是否有任何理论/经验基础可以说歧视参数是项目参数?怎么能确定呢?

  2. 上面提到的人歧视参数模型有没有相关的参考资料?

4个回答

@KH Kim,我相信任何数学模型遇到现实世界时都会遇到一些困难。在 IRT 模型中,项目和项目参数对于回答这些项目的个人池是不变的——这是模型的理论构建块。这是一个非常深入的对话,你正在沉浸其中,但我建议这是一个构建块问题 - 你是否接受数学模型......

问题可能是样本量。使用 2 参数模型 (300-500) 的稳定项目估计通常需要较大的响应组。还假设用于实现稳定估计的样本反映了总体而不是子集。如果您的样本的区分参数似乎不同,那么问题可能不在于模型,而是将检查/调查应用于不合适的组。

判别参数是一个项目参数,因为它在模型中是如何指定的

respipαi(θpβi)

其中 i 代表项目,p 代表人员。在这个模型中,人(仅由θ) 与歧视参数无关。

IRT 对人和项目之间的交互进行建模,项目参数试图描述它们对交互的影响。

IRT 模型可以扩展为包括您提出的问题类型。例如,如果您有一个随机治疗组和一个对照组,您可以指定类似

respip(α1+α2Ipcontrol)×(θpβi)

在哪里α2可以解释为治疗组和对照组之间的歧视差异。您可以通过许多其他对您的情况感兴趣的方式扩展模型。这些模型很容易安装在 Jags 或 Stan 等灵活的建模软件中。

这更像是一个太长并且必须编辑的评论,而不是一个答案购买......


我不太了解这些模型,但记住它们是在考虑个人属性(能力、态度或个性等特征)的基础上开发的,这可能会有所帮助。然后,该模型将对特定项目的反应描述为个人在这些潜在特征上的得分的函数。当然,每个人对一个项目的反应不同,但这些个体差异是由个人在相关特征上的水平而不是其他参数来捕捉的。每个人的功能形式和项目参数都相同是一个必要的假设,以使其易于处理。

此外,情境变量或瞬态(情绪、疲劳……)也很麻烦。根据定义,特质是一个人的稳定属性,应尽一切努力将其他变量对测量的影响降至最低。

将此扩展到心理物理学,它可能是一些检测阈值(而不是亮度本身),这将被解释为一种特征,这就是区分和项目特征曲线将应用于的内容。是否有意义?

我发现这篇文章尝试了一个具有特定于人的歧视参数的模型

一种用于评估二元人格反应中项目和人员歧视的 IRT 建模方法

我应该先试试!

与此相关,对于多头数据,

Wolfe 和 Firth (2002),在多期交叉实验中对序数响应量表的主观使用进行建模