卡方统计量越远离预期条目越大。p 值变小。非常小的 p 值表示“如果等概率的原假设为真,那么真的不太可能发生”(通常的结论是,在它们不是同样概率的情况下发生了不太显着的事情)。
细胞计数的正确卡方值为 1500 1500 1500 15000,正确的 p 值为 1:
chisq.test(c(1500,1500,1500,1500))
Chi-squared test for given probabilities
data: c(1500, 1500, 1500, 1500)
X-squared = 0, df = 3, p-value = 1
您的卡方统计公式是错误的。您发布的其中一张图片有1500 1500 0 1500. 在这种情况下,卡方值为 1500,p 值实际上为 0:
chisq.test(c(1500,1500,0,1500))
Chi-squared test for given probabilities
data: c(1500, 1500, 0, 1500)
X-squared = 1500, df = 3, p-value < 2.2e-16
因此,当你应该得到 0 时,你计算了一个 1 的卡方,当你应该得到 1500 时计算了 0。
你用的是什么公式?
(额外检查 - 这四个更典型的计数
1 2 3 4
1481 1542 1450 1527
你应该得到一个 3.5693 的卡方)
---
关于使用卡方检验来测试骰子的公平性,请参阅此问题
我在那里给出了一个答案,指出 - 如果你真的想测试骰子 - 你可能会考虑其他测试。
---
正如您在回复中指出的那样,CHITESTExcel 中的函数返回 p 值而不是测试统计量(这对我来说似乎有点奇怪,因为您可以使用 得到它CHIDIST)。
在所有期望值都相同的情况下,快速获取卡方值本身=SUMXMY2(obs.range,exp.range)/exp.range.1的obs.range方法exp.range是exp.range.1使用(或实际上任何其他)值exp.range,给出如下内容:
1 2 3 4
Exp 1500 1500 1500 1500
Obs 1481 1542 1450 1527
chi-sq. p-value
3.5693 0.31188
一个稍微笨重但更简单的替代方法是使用CHIINV(p.value,3), 来获得卡方统计量,其中p.value是 的返回值的范围CHITEST。
--
编辑:这是您发布的两组数据的几个图。
灰色实线是每个面出现在公平骰子上的预期次数。
如果骰子是公平的,那么内部的一对虚线是大约 95% 的时间应该在这个范围内的个人面结果。(因此,如果您掷出 d20,您会期望一张面上的计数 - 平均而言 - 超出内部限制。)
外面的一对虚线是近似的 Bonferroni 限制,如果骰子是公平的,那么所有面的结果将在大约 95% 的时间范围内。如果任何计数超出这些范围,您就有理由怀疑骰子可能有偏差。

编辑以添加一些解释-
基本情节只是计数的情节。对于具有面的骰子,给定面出现的次数(单个计数)有效地分布为二项式。如果零假设(公平骰子)为真,则为二项式。k(N,1/k)
二项式的平均值和标准差。(N,p)μ=Npσ=Np(1−p)−−−−−−−−√
因此,中央灰线标记为。你已经知道该怎么做了。μ=N/k
如果很大并且不太接近 0 或 1,则标准化的计数 ( ) 将很好地近似按标准正态分布。大约 95% 的正态分布位于平均值的 2 个标准差以内。处绘制了内部虚线。这些计数不是相互独立的(因为它们添加到滚动总数中,它们必须是负相关的),但它们分别具有大约 95% 水平的限制。Np=1/kith(Xi−μ)σμ±2σ
请参阅此处,但我使用而不是 - 这没什么影响,因为我不在乎它是否是 95.4% 间隔而不是 95%,而且它只是近似值。z=2z=1.96
所以这给出了虚线。
相应地,如果投掷次数都是独立的(正如我所提到的,它们并不完全独立),那么它们都位于某个范围内的概率是一个概率的幂。粗略估计,对于独立试验,如果您希望(所有面)落在边界外的总体比率约为,则个体概率应约为(这里有几个近似阶段,而不是甚至计算正态近似值;要真正准确地工作,您需要很多面孔和超出限制的小概率)。kth5% 0.05/k
因此,对于个面和总体的超出限制的比率,我希望个别超出每个限制的概率大约是该限制的一半或。4 个面的比例为高于上限,低于下限。k5%0.025/k0.025/4=0.006250.00625
处绘制了四面骰子 (d4) 情况的外部限制,其中截断了上尾标准正态分布的这大约是(同样,对限制过于准确并不值得,因为我们正在逼近这个东西)。μ±cσc0.006252.5
d6 的工作原理类似,但它的限制切断了的上尾区域,这大致对应于正态分布的0.025/6c=2.64
对于 d4,如果原假设为真,则任何计数超出平均值 2.5 个标准差的外部边界的实际病例比例实际上约为 4.2%(我通过模拟得到)——很容易接近出于我的目的,因为我并不特别需要它是 5%。d6 的结果将接近 5%(结果约为 4.5%)。因此,所有这些近似水平都工作得很好(忽略计数之间存在负相关性、个体尾部概率的 Bonferroni 近似以及二项式的正态近似,然后将这些截止值四舍五入到某个方便的值)。
这些图表并非旨在取代卡方检验(尽管它们可以),而是更多地提供视觉评估,并帮助确定对卡方结果大小的主要贡献。