骰子的卡方分布不返回预期值?

机器算法验证 假设检验 卡方检验 擅长 骰子 卡方分布
2022-04-07 23:00:33

我正在尝试验证我的骰子是否相当公平和平衡。不过,我不确定我做得对,因为我基本上是在没有参考资料的情况下自学统计数据。为了实现这一点,我选择了卡方检验。这就是我正在做的事情:

我有一个样本大小的卷。在一个 dC 上,其中是边数,每个滚动 1 到的预期频率是然后我计算然后,我计算自由度等于的卡方分布(在 Excel 中使用) NCCNCχ21CCHIDISTC1

这是一个示例案例:

  • 取一个 d4,并假设每个面都被平均滚动了 1500 次。
  • 计算这个的卡方值,每张脸和预期频率为 1500
  • chidist使用和 3 作为自由度计算卡方分布

问题是,这会返回无意义的值。例如,在 d4 上,如果我输入 6000 个均匀分布的卷,则chidist返回.801252. 无论我赚多高,即使分布均匀,我也不会低于我知道我在这里做错了什么,但我不确定它是什么。N.801252

卡方分布值应该落在任何类型的显着性范围内。有什么帮助吗?


编辑:根据请求,我发布了我的 Excel 布局的屏幕截图并列出了使用的公式。我隐藏了不相关的行。

在此处输入图像描述

使用的公式:

  • C2:C5 = B22/4(频率)
  • B22 = SUM(B2:B5)(和)
  • (StDev 和 StdErr 不相关)
  • B25 = CHITEST(B2:B5, B91:B94)(卡方)
  • B26 = CHIDIST(B25, B1-1)(智分布)

以下是一些原始数据:

   4  -  6
1| 56    36
2| 45    33
3| 57    33
4| 42    40
5|       29
6|       29
1个回答

卡方统计量越远离预期条目越大。p 值变小非常小的 p 值表示“如果等概率的原假设为真,那么真的不太可能发生”(通常的结论是,在它们不是同样概率的情况下发生了不太显着的事情)。

细胞计数的正确卡方值为 1500 1500 1500 15000,正确的 p 值为 1:

 chisq.test(c(1500,1500,1500,1500))

    Chi-squared test for given probabilities

data:  c(1500, 1500, 1500, 1500)
X-squared = 0, df = 3, p-value = 1

您的卡方统计公式是错误的。您发布的其中一张图片有1500 1500 0 1500. 在这种情况下,卡方值为 1500,p 值实际上为 0:

 chisq.test(c(1500,1500,0,1500))

    Chi-squared test for given probabilities

data:  c(1500, 1500, 0, 1500)
X-squared = 1500, df = 3, p-value < 2.2e-16

因此,当你应该得到 0 时,你计算了一个 1 的卡方,当你应该得到 1500 时计算了 0。

你用的是什么公式?

(额外检查 - 这四个更典型的计数

   1    2    3    4 
1481 1542 1450 1527 

你应该得到一个 3.5693 的卡方)

---

关于使用卡方检验来测试骰子的公平性,请参阅此问题

我在那里给出了一个答案,指出 - 如果你真的想测试骰子 - 你可能会考虑其他测试。

---

正如您在回复中指出的那样,CHITESTExcel 中的函数返回 p 值而不是测试统计量(这对我来说似乎有点奇怪,因为您可以使用 得到它CHIDIST)。

在所有期望值都相同的情况下,快速获取卡方值本身=SUMXMY2(obs.range,exp.range)/exp.range.1obs.range方法exp.rangeexp.range.1使用(或实际上任何其他)值exp.range,给出如下内容:

    1       2       3       4
Exp 1500    1500    1500    1500
Obs 1481    1542    1450    1527

    chi-sq. p-value     
    3.5693  0.31188     

一个稍微笨重但更简单的替代方法是使用CHIINV(p.value,3), 来获得卡方统计量,其中p.value是 的返回值的范围CHITEST

--

编辑:这是您发布的两组数据的几个图。

灰色实线是每个面出现在公平骰子上的预期次数。

如果骰子是公平的,那么内部的一对虚线是大约 95% 的时间应该在这个范围内的个人面结果。(因此,如果您掷出 d20,您会期望一张面上的计数 - 平均而言 - 超出内部限制。)

外面的一对虚线是近似的 Bonferroni 限制,如果骰子是公平的,那么所有面的结果将在大约 95% 的时间范围内。如果任何计数超出这些范围,您就有理由怀疑骰子可能有偏差。

d4 结果图,有界 d6 结果图,有界


编辑以添加一些解释-

基本情节只是计数的情节。对于具有面的骰子,给定面出现的次数(单个计数)有效地分布为二项式如果零假设(公平骰子)为真,则为二项式k(N,1/k)

二项式的平均值和标准差(N,p)μ=Npσ=Np(1p)

因此,中央灰线标记为你已经知道该怎么做了。μ=N/k

如果很大并且不太接近 0 或 1,则标准化的计数 ( ) 将很好地近似按标准正态分布。大约 95% 的正态分布位于平均值的 2 个标准差以内。处绘制了内部虚线这些计数不是相互独立的(因为它们添加到滚动总数中,它们必须是负相关的),但它们分别具有大约 95% 水平的限制。Np=1/kith(Xiμ)σμ±2σ

请参阅此处,但我使用而不是 - 这没什么影响,因为我不在乎它是否是 95.4% 间隔而不是 95%,而且它只是近似值。z=2z=1.96

所以这给出了虚线。

相应地,如果投掷次数都是独立的(正如我所提到的,它们并不完全独立),那么它们位于某个范围内的概率是一个概率的幂。粗略估计,对于独立试验,如果您希望(所有面)落在边界外的总体比率约为,则个体概率应约为(这里有几个近似阶段,而不是甚至计算正态近似值;要真正准确地工作,您需要很多面孔和超出限制的小概率)。kth5% 0.05/k

因此,对于个面和总体的超出限制的比率,我希望个别超出每个限制的概率大约是该限制的一半或4 个面的比例为高于上限,低于下限。k5%0.025/k0.025/4=0.006250.00625

处绘制了四面骰子 (d4) 情况的外部限制,其中截断了上尾标准正态分布的这大约是(同样,对限制过于准确并不值得,因为我们正在逼近这个东西)。μ±cσc0.006252.5

d6 的工作原理类似,但它的限制切断了的上尾区域,这大致对应于正态分布的0.025/6c=2.64

对于 d4,如果原假设为真,则任何计数超出平均值 2.5 个标准差的外部边界的实际病例比例实际上约为 4.2%(我通过模拟得到)——很容易接近出于我的目的,因为我并不特别需要它是 5%。d6 的结果将接近 5%(结果约为 4.5%)。因此,所有这些近似水平都工作得很好(忽略计数之间存在负相关性、个体尾部概率的 Bonferroni 近似以及二项式的正态近似,然后将这些截止值四舍五入到某个方便的值)。

这些图表并非旨在取代卡方检验(尽管它们可以),而是更多地提供视觉评估,并帮助确定对卡方结果大小的主要贡献。