均匀分布的统计检验

机器算法验证 假设检验 拟合优度 均匀分布
2022-04-15 04:57:34

我有来自已知区间 [0, 10] 的 5 个数字的样本。5个数字是否足以对这些数字是否来自均匀分布做出一些结论?

1个回答

去测试U(0,10)n=5?

可靠性不高,除非它非常不均匀。

如果您期待 U 形替代方案,您可能会考虑说一个 Anderson-Darling 测试,(它通常在功率研究中表现良好,因此更普遍地记住它是一个很好的) - 但功率在n=5会很低。

它比对 U 形替代品的 Kolmogorov-Smirnov 测试要强大得多。

对于山形替代方案(例如 beta(3,3)),在 n=5 时,Anderson-Darling 非常有偏见(即远小于α拒绝的概率),所以这不是一个很好的选择,并且 Kolmogorov-Smirnov 测试做得更好(尽管它也有偏见 - 这意味着您可以通过滚动 20 面骰子来对抗 beta(3,3)并在出现“1”时拒绝)。

这是一个关于 n=5 时偏差问题有多严重的想法(这里我使用了 10% 的显着性水平,因为n这么小):

在此处输入图像描述

使用在一端“堆积”概率的倾斜替代方案(例如 beta(2,1)),这两个测试的功效是合理的 - 有点像 U 形情况的功效,但二更相似。


考虑到这些问题,这里有一些后续问题

为什么要测试均匀性?

您对可能的替代方案有任何了解吗?
(如果你能缩小备选方案的范围,你也许可以构建一个至少有一点效力的测试。)

这两种错误的相对成本是多少?