编辑:请注意,这个问题不是关于同一事件的多个不可靠证人,而是多个事件,每个事件只有一个证人。单独指控事件的累积是否应该改变我们对任何个别指控事件的怀疑程度?
这是一个关于许多人对犯罪和诬告所做的非正式统计推理的问题。我想知道“常识”响应是否具有数学意义。
这是禁酒令的中间。一位著名的政治家被指控在聚会期间喝了大量的酒。他说,他只是在医生严格建议后才服用药物。他说,这些都是他的政敌的粗俗、完全错误的指控。
多数人说:“不比谣言可靠,他有很多政敌,有理由诬告他,还有很多疑问。”
然后其他一些人对他提出了同样的指控;不同的时间,不同的地方,不同的聚会,但总是喝很多。
在这些报道之后,大多数人说,“只有一个指控者,我们是怀疑的;现在,有许多额外的指控,毫无疑问第一个指控是真的。”
这种常见的非正式统计推理是否合理?
如果你用贝叶斯推理来处理这个问题,请记住,问题不是“额外的指控是否会改变第一个指控为假的可能性?”而是“额外的指控是否会导致我们的水平发生很大变化?对第一个指控有疑问?”
现在让我们添加一系列先前的假设。它们中的任何一个都改变了非正式统计推理的可靠性吗?
- 饮酒量高度倾斜,少数人饮用大部分酒精。(这个假设在今天仍然正确,因为它发生了,尽管这种偏差可能没有禁酒令期间那么极端。)
这种假设是否会对我们的怀疑随着新指控的出现而改变的方式产生任何影响?
- 绝大多数人——比方说,超过 99%——都是诚实的,绝不会做出这样的虚假指控。(请注意,我们的大多数非正式推理者对此都是错误的;他们假设的不诚实比实际存在的要多得多。)
那会有什么不同吗?
最后:
- 控告者的分布也有偏差:大多数可以提出真实指控的人都闭口不言,因为承认自己参加了聚会会损害自己的声誉;大多数提出指控的人都会提出真正的指控;极少数人一再诬告。但是,我们没有证据可以确定原告属于哪个群体。
那会有什么不同吗?如果会,偏斜量会产生什么影响?
如果这些因素产生影响,那么哪一个影响最大?
我热切地等待 Stack Exchange 最优秀的人才的意见。再一次记住,问题是在更多的指控浮出水面之后,我们对最初指控的怀疑程度是否应该改变一点、很多,或者根本不改变。