我有时很难理解某些测试背后的直觉。知道为什么某些测试在特定情况下有效是否重要,还是足以在“好的,现在我可以检查同方差性”或“我不知道为什么我们在 Mann-Whitney U- 中除以 12”的水平上学习东西测试,但相信我,它有效”?或者是否有书籍作者解释了每个测试背后的想法并提供了一些理由来“证明”测试有效?
对为什么各种统计测试有效的直觉有多重要?
从广义上讲,您对测试(或实际上在统计中所做的各种计算的任何其他方面)了解得越多越好,但通常不需要了解公式中每个常数的每个具体细节才能很好地理解这是怎么回事。
例如,有时(特别是在尝试计算零假设下的分布时),人们将 Spearman 相关性表述为, 在哪里是之间的区别排名和秩。有必要了解“6”从何而来吗?如果您只是想对测试有直觉,我认为没有必要(尽管实际上它非常简单)-如果您将测试理解为“根据等级计算的相关性”,那么您几乎拥有大部分有用的直觉。有一些额外的直觉可以从它也可以写成平方秩差的线性函数这一事实中收集到,但常数本身并不是特别有启发性。
您可以通过多种方式轻松检查公式(例如,通过计算“等级相关性”形式和“' 形式用于一些小样本),并且您可以很容易地检查零分布(通过简单枚举非常小的样本,并通过模拟更大的样本),而不必知道如何进行代数。
我敦促你尽可能多地做——我从这些方面学到的东西在某些方面没有帮助——但当你做不到的时候不要担心太多。总有一些地方你可以询问细节是如何形成的(在 Spearman 相关的情况下,其中一些细节已经在这里解释过)。
关于 t 检验的基本直觉将包括,例如,分母试图测量的内容(不同 t 统计量的公式看起来不同,但它们总是对分子分布的标准差的估计),以及如果可能的话,为什么不同的分子是这样的,以及为什么分母是它们所具有的形式。
使用 F 检验,知道分子和分母是方差的两个不同估计当然很有用 - 如果 null 为真,则应该是相同方差的独立估计。(了解分布如何随着自由度的变化而变化也很有用。)
了解正在发生的事情的更多细节从来都不是坏事,但我认为有一个中间立场。例如,采用 pdf 法线密度的公式
您是否需要知道这是如何得出的以及为什么它的每个部分都是这样的,以便了解很多关于正常性及其要求的信息?不,但最好知道的不仅仅是“残差的正态性是一个要求”。
(以上是如果你是数据分析师类的统计学家;如果你想证明定理等,你需要对这类事情有更多的了解)。