我有来自已知区间 [0, 10] 的 5 个数字的样本。5个数字是否足以对这些数字是否来自均匀分布做出一些结论?
均匀分布的统计检验
机器算法验证
假设检验
拟合优度
均匀分布
2022-04-15 04:57:34
1个回答
去测试和?
可靠性不高,除非它非常不均匀。
如果您期待 U 形替代方案,您可能会考虑说一个 Anderson-Darling 测试,(它通常在功率研究中表现良好,因此更普遍地记住它是一个很好的) - 但功率在会很低。
它比对 U 形替代品的 Kolmogorov-Smirnov 测试要强大得多。
对于山形替代方案(例如 beta(3,3)),在 n=5 时,Anderson-Darling 非常有偏见(即远小于拒绝的概率),所以这不是一个很好的选择,并且 Kolmogorov-Smirnov 测试做得更好(尽管它也有偏见 - 这意味着您可以通过滚动 20 面骰子来对抗 beta(3,3)并在出现“1”时拒绝)。
这是一个关于 n=5 时偏差问题有多严重的想法(这里我使用了 10% 的显着性水平,因为这么小):

使用在一端“堆积”概率的倾斜替代方案(例如 beta(2,1)),这两个测试的功效是合理的 - 有点像 U 形情况的功效,但二更相似。
考虑到这些问题,这里有一些后续问题:
为什么要测试均匀性?
您对可能的替代方案有任何了解吗?
(如果你能缩小备选方案的范围,你也许可以构建一个至少有一点效力的测试。)
这两种错误的相对成本是多少?
其它你可能感兴趣的问题