统计中的细分

机器算法验证 贝叶斯 非参数 假设 应用
2022-03-21 07:31:33

不久前,我正在与一位统计学教授讨论统计学的不同“风格”(频率学派、贝叶斯学派……)。他提出他会将统计数据细分为四类:非参数统计、稳健统计、频率统计和贝叶斯统计。细分的特点是方法对基础分布做出的假设数量(非参数统计没有做出任何假设,而贝叶斯使这些假设非常明确)。

我本来想问 CrossValidated 是否同意这个细分,但由于这是一个主观问题,我会问:

1)这个细分在统计学中是否被广泛认可;

2)“现实世界”的问题通常需要一种特定的方法吗?即,给定一些问题,是否有最适合解决该问题的方法,或者多种方法可以解决给定问题?

提前致谢。

2个回答

我不会像常客和贝叶斯那样将非参数或鲁棒视为统计的子类别,这仅仅是因为对于非参数和鲁棒统计,既有常客方法也有贝叶斯方法。频率论者和贝叶斯论者是真正的子类别,因为它们基于根本不同的概率定义。频率论者和贝叶斯论者都会根据应用程序的要求改变假设的强度。

所以我想说的是,特定的细分为四个类别在统计学中并未得到广泛认可。在我看来,贝叶斯方法和频率论方法都可以用于大多数统计问题,但是它们并不总是同样有用,例如频率论置信区间或贝叶斯可信区间是否更合适取决于您是否想问关于如果重复实验会发生什么,或者我们可以根据我们实际执行的特定实验得出的关于统计数据的结论(我建议在大多数情况下是后者,但科学家们通常使用频率论方法)。

我不一定断言这些是统计数据中存在的细分。如果有压力,我认为频率论者与贝叶斯论者是最明确的划分,尽管在边缘情况下即使这样也有些模糊,而且实践中的大多数人似乎是两者的混合体。

稳健和参数/非参数并不是真正的划分,而是针对不同问题的不同工具。诚然,有些人只解决让自己适合其中一个或另一个的问题,但那是人,而不是实际的统计数据——我什至认为大多数人都不是。举个例子,我认为锤子和螺丝刀之间没有“木工细分”,尽管我认识一个讨厌使用钉子的人。

我想说统计学中更深刻的划分是如何从数学家与专业统计学家与具有统计学知识的应用研究人员的角度看待它。

回答你问题的第二点:有时

有时您必须使用一种方法 - 因为该方法旨在在其他方法失败时起作用。我想到了确切的统计数据。但是有很多很多问题需要多种方法起作用。例如,我正在处理的一个项目可以使用贝叶斯或频率方法来处理,并使用参数、半参数或非参数方法。这是六种可能的工具组合,以及每种工具的可信论据。最后,在这个项目中,我选择了对我最有用的方法