峰度的“尾巴”是什么意思?

机器算法验证 自习 峰度 肥尾 重尾
2022-03-22 06:28:48

有两种峰态类型:阳性(leptokurtic)和阴性(platykurtic)。leptokurtic 是重尾的,而 platykurtic 是细尾的。但是 leptokurtic 比 platykurtic 更薄更尖,所以我认为 leptokurtic 是细尾的……但它是重尾的。所以我发现我误解了“尾巴”的意思

尾巴是什么意思?

3个回答

这里有两个部分要解决—— 1. 重尾是什么意思?2. 峰度越高是否意味着尾巴越重,反之亦然?

  1. 重尾是什么意思?

    一个。较重的尾巴在“手摇”的意义上意味着什么——大多数人是这样想象的:

    在此处输入图像描述

    但是因为尾巴很小,最好看对数密度(它保留了密度高度的顺序)

    在此处输入图像描述

    (然而,在很多情况下,这种手摇感觉都失败了,包括当你试图包含不连续和单峰分布的相当基本的情况时)

    湾。更严格地说,重尾的一个很好的定义(关于它,请参见whuber 的回答)是,如果的尾比重,随着变得足够大,那么对于所有 fr some,其中是幸存者函数[这当然是右侧较重的尾巴;而不是而言,左尾重尾会有类似的定义当两条尾巴都在考虑之中时,因为它们需要用于比较峰度,如果它更重,“更重的尾巴”将适用YXtSY(t)>SX(t)t>t0t0S1FFS两条尾巴。]

    (同样,如果您想查看它,对数尺度比较通常比直接比较更有用)S(t)

  2. 重尾与峰度有何关系?

    现在我们对什么是重尾有了一个定义,你问题中的前提(不是你自己的,因为它在无数教科书中)是错误的——重尾和更高的第四标准化时刻之间没有绝对普遍的联系。通常情况下,峰度越高,尾部重,反之亦然——例如,当将 at(5) 与正常值进行比较时,我们会看到这种情况——但情况并非总是如此;根据 2.b 中的定义,我们可以很容易地找到一个尾尾较轻的分布。然而,它具有更高的峰度。看这个例子—— t 和 10d.f。与拉普拉斯:

    ![在此处输入图像描述

    (在这种情况下,因为总是高于某个点,幸存者函数至少在该区域也必须更高,因此我们可以坚持使用密度进行比较。请注意,这两个密度交叉六次。拉普拉斯有大约 2.5145 和 12.8 之间的较高尾部,以及较高的峰值;即使其极端尾部较低,这也使其峰度较高)f

来自可能已删除的重复问题的评论很有用:

事实上,较高的峰度与增加的峰度和较重的极端尾部相关,但在这两种情况下都没有必然的关系(您可以找到较高峰度或较重的极端尾部的反例,即使两者都是典型的较高峰度)。在任何一种情况下,各种形状都是可能的。– Glen_b♦ 2013 年 9 月 17 日 11:10

Kendall 和 Stuart(我认为在第一卷中)针对峰尾的各种组合提出了一系列反例。另请参阅此处的讨论 – Glen_b♦ 2013 年 9 月 17 日 11:16

另见 Kevin P. Balanda 和 HL MacGillivray 的论文。“峰度:批判性评论”。美国统计学家 42:2 [1988 年 5 月],第 111-119 页。(是的,一般来说,fat-tailed 和 heavy-tailed 是同义词,除了其中一个或两个都被明确定义的上下文。) – Glen_b♦ 2013-09-17 11:23:47

您可能想阅读以下论文:DeCarlo, LT (1997)。关于峰度的含义和使用。心理方法, 2(3), 292. – Alecos Papadopoulos 2013-09-17 23:31

关于 DeCarlo 论文的一个警告——摘要的第一句话是错误的!即使对于对称的单峰分布,高峰态并不意味着“峰化”,而低峰态并不意味着平坦。存在具有极高(甚至无限)峰度的对称单峰平顶分布;也存在具有负超峰度的无限峰值分布。请参阅此处给出的具体示例:en.wikipedia.org/wiki/... – Peter Westfall 2017 年 10 月 21 日 12:20

Glen_b,您的“您可以找到较重的极端尾部的反例,尽管两者都是典型的具有较高峰度的”只有在您以无限方式以特定方式定义“较重的极端尾部”时才是正确的。对于所有 b 的 (i) 作为峰度趋于无穷大,E(Z^4*I(|Z| >b))/峰度 ->1 的数学事实没有反例;(ii) 峰度在 E(Z^4*I(|Z| > 1)) +.5 的 +- .5 范围内;这两个陈述都解释了峰度如何与分布的尾部相关,而不是与峰值相关。如果您将“重尾”定义为更大的“E(Z^4*I(|Z| > 1))”,那么您就有峰度。– 彼得韦斯特法尔 2017 年 11 月 15 日 23:32

Glen_b,您的评论“事实上,更高的峰度与增加的峰度...”在面对众多反例时似乎显然是错误的。你能提供一个定理来证明它吗?– 彼得韦斯特法尔 2017 年 11 月 20 日在 1:43

以上以及问题本身都源于峰度是什么。查看定义峰度的物理问题可能很有用。为此,关于平均值的四阶矩类似于围绕其平均质量或垂直平衡点旋转的薄片材料,作为扭矩变化率的变化率。这几乎没有说明薄片在距旋转轴任何特定距离处的高度,而是整个薄片的整体行为。

峰度和分布尾部之间肯定存在直接关系。一个简单的连接如下:让是任何具有有限四阶矩的随机变量,让,让那么的峰度是XZ=(Xμ)/σU=Z4XE(U)

教学和理解期望的常用方法是使用“平衡点”概念,其中随机变量的期望值等于分布图平衡的横轴上的点。

考虑的概率分布函数 (pdf) 图,并在横轴上定位值 3.0。这是正态分布的峰度。如果 pdf 在 3.0 的右边太重,以至于试图在 3.0 平衡时被拉到右边,那么峰度大于 3.0,的分布可以说是“重尾比正态分布。” 反之,如果的 pdf太轻到 3.0 的右边,以至于试图在 3.0 处平衡时曲线被拉到左边,那么峰度小于 3.0,的分布可以说是“比正态分布更轻”。UXUX

根据上述讨论,“尾部杠杆”可能比“尾部质量”更好地表征峰度。尾部质量越大,峰度越小,尾部质量越小,峰度越大。这完全取决于质量的偏远;即,它取决于杠杆。

表明峰度主要由尾部确定的精确数学逻辑如下:

对于具有有限四阶矩(离散、连续、偏斜、经验)的随机变量的所有可能分布,峰度必然介于X

Z4I(|Z|>1)dF(Z)

Z4I(|Z|>1)dF(Z)+1 ,

其中Z=(Xμ)/σ

对于此类中的密度在区间上递减的连续分布,“ ”减少到“ ”或更小。Z2[0,1]+1+.5

最后,对于峰度趋于无穷大的任何分布序列,k

Z4I(|Z|>b)dF(Z)/k1 ,

对于所有真正的b

这些都是数学定理,所以没有反例。

因此,决定峰度值的Z

是的,还有其他不是峰度的尾权度量,实际上有无穷多个。因此,如果峰度不对应于特定的尾重测量值,则说明峰度不测量尾重是一个红鲱鱼。这是一个没有支持的概括,仅仅因为峰度没有测量无限多个尾权度量中的一个,峰度本身也没有测量尾权。

我没有看到通常将峰度与峰值或范围内的概率集中联系起来的定理,但我已经看到了很多此类概念的反例。谁能指出这样的定理?μ±σ

我上面提到的三个定理在 Westfall, PH (2014) 中得到了证明。峰度作为峰度,1905 – 2014 年。美国统计学家 RIP,68,191–195。 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/

编辑,2018 年 7 月 18 日:又一个将峰度连接到尾部(而不是峰值)的定理。采用任何分布(或数据集)。在平均值的一个标准偏差内删除数据或质量。以您喜欢的任何方式替换数据/质量,但保持平均值和标准偏差与原始数据/分布相同。那么所有此类替换的最大和最小峰度之差为

如果你用尾巴玩同样的游戏,差异是无限的。