邓宁-克鲁格效应主要是由均值回归引起的吗?

机器算法验证 回归 错误 回归均值
2022-03-14 21:07:38

Bland 对均值回归的讨论中,有几个部分详细介绍了均值回归的示例,我认为这是由于没有对每个受试者的多次测量取均值而​​不可避免的结果。在题为“两种测量方法的比较”的部分中,Bland 指出了将测量的重量与自我报告的重量进行比较的研究。该研究的结论是,超重的人倾向于少报自己的体重,而体重过轻的人倾向于多报自己的体重。Bland 说,这是由于回归均值所致。

根据我的理解,这种比较范式与用于建立邓宁-克鲁格效应的范式相同,即不熟练的人认为自己比实际熟练,而熟练的人认为自己的熟练程度低于实际水平。真的是。

似乎,如果布兰德是正确的,邓宁-克鲁格效应更像是一种统计假象,不一定是现实。我粗略地阅读了支持邓宁-克鲁格效应的论文,似乎它们确实依赖于两种“工具”的单一测量(自我报告与测量)。

我是否遗漏了什么,或者实际上是否有强有力的证据表明邓宁-克鲁格效应在回归均值方面是稳健的?

2个回答

只是一个人工制品”听起来可能完全是由于回归均值。这是一个非常强烈的声明。事实上,Kruger & Dunning 在其原始论文的第 4.1.3 节中已经解决了这个问题(“回归效应”在这里代表“回归均值”):

尽管回归效应是不可避免的,但我们认为我们观察到的高估更多是心理上的,而不是人为的。一方面,如果我们的结果仅归咎于回归,那么底部四分位数之间的错误校准幅度将与顶部四分位数的幅度相当。

事实并非如此。他们的图 1 显示,表现最差的公司高估了他们的表现,而表现最好的公司低估了他们的表现。

此外,克鲁格和邓宁明确地进行了额外的研究(他们原始论文中的研究 3 和 4)来解决这个问题,他们的研究 3 和 4 的结果与实际的潜在心理影响一致。

当然,均值回归会对基本的 Dunning-Kruger 设置产生影响,人们可以设想一种置换检验方法来估计 Dunning-Kruger 设置在多大程度上是由它引起的。尽管如此,我的印象是那里还有更多的东西。

邓宁-克鲁格仅表明,几乎每个人,无论实际能力水平如何(能力非常高的人除外),都认为自己的表现高于平均水平。 这一点也不奇怪,因为人们会根据更典型的人来判断自己的能力——因为那里有更多典型的人,然后是非常罕见的人。DK 没有表明低技能的人认为他们优于高能力的人,这是对该研究的常见且方便的误解。它确实表明低能力的人认为他们“相对”,比他们实际上更有能力。

当然,一个重要的考虑因素是衡量“能力”本身。例如,在“逻辑能力”的测试中,根据最近对理性和直觉的研究,人们应该考虑到,在有严格时间限制的测试中,明显高的推理能力并不能转化为实时理性行事。换句话说,已经确定一个人在测试中的表现如何,并不能直接转化为他们在任何给定时间点进行理性思考(在这种情况下是“逻辑”)思考的可能性。Chudhursky 在 2012 年还确定,当在流畅推理测试中放宽时间限制时,在严格的时间限制下,性能与性能失去相关性。换句话说,当时间限制放宽时,有些人的表现会好很多。所有这一切都意味着,在非常窄的时间窗口内根据表现人为地创造能力等级是一种有缺陷的做法。