为什么 PDF 的中位数并不总是等于平均值​​?

信息处理 可能性 概率分布函数
2022-02-10 11:48:34

在研究概率密度函数 (PDF) 时,重点通常放在“均值”而不是“中值”上。平均值通常被描述为 PDF 的质心。我一直认为这是真的。

但是,中位数的定义似乎与我认为的质心相对应。该定义是:

medianpdf(x)dx=12

看看这个,我们基本上是在集成 PDF 直到我们到达中途点。对我来说,这似乎与我们认为的质心相同。

那么,如果平均值是质心,为什么在我们到达一半(中位数)之前积分 PDF 并不总是等于平均值​​?

请注意,我从一般统计的角度理解平均值和中位数之间的差异,但从 PDF 的角度来看我很好奇。

我还将按以下方式格式化问题:

pdf(x)dx=mass

xpdf(x)dx=centerofmass

如果我们定义以下等式:

Tpdf(x)dx=mass2

为什么 T 不总是质心?如果函数是对称的,看起来 T 是质心,但是如果函数是非对称的,为什么它不成立呢?

3个回答

如果您将 pdf 视为定义无限长度和可变密度的细棒中的质量分布(因此,棒的“每英寸重量”取决于我们谈论的棒的哪个部分),那么平均值是杆完全平衡的点(也就是说,如果我们设置一个支点并将杆放在上面,如果支点在平均值处,它将是水平且完美平衡的,并且会在一侧向下倾斜如果支点在其他任何地方,则为另一个。

另一方面,中位数是我们可以说一半质量在中位数左侧,一半质量在中位数右侧的点。如果这就是让你的船漂浮起来的真正的和唯一的“质心”的含义,并且你觉得其他所有相信其他人的人都处于致命的罪恶状态,那就这样吧。请注意,当您将中位数称为质心时,您可能会被那些尚未达到启蒙状态并且仍然认为质心是他们所谓的另一种名称的凡人误解。 pdf 或随机变量的平均值

关于关于非对称 pdf 的主要问题的评论意味着平均值和中位数将不同,这个答案在 stats.SE 上(这个问题更合适)给出了一个非对称 pdf 的例子,其平均值,中位数众数都具有相同的值。

将一个孩子放在重量相同的跷跷板的两侧。中位数是中位数。当两者与支点的距离相同时,系统是平衡的。一个孩子远离支点,系统将朝那个方向旋转。中位数保持不变,重心移向离得更远的孩子。

另一个例子是纽约曼哈顿这样的地方的财富统计。相对于更多的中低收入个人而言,相对较少的亿万富翁的存在使平均收入偏高,而中位数则更具代表性

俗话说:

  • 中位数是左右总重量相同的地方
  • 均值是您在左右之间取得平衡的地方

质心(又名质心或质心)考虑了杠杆效应或施加质量的位置。因此,被积xp(x)在积分符号下。

相比之下,中位数并不真正关心质量的位置。因此单 p(x)积分。

两者都与一类“动量”(动量的复数,或“动量”,它们是与位置周围的“pdf 如何分布”或形状因子相关的值,具有不同的位置权重。经典(居中)时刻写成:

(xxc)Mp(x)dx

0时刻 x0p(x)dx 等于1根据定义。每个位置x, 受0次幂,变成“无位置”。中位数削减如果在两个相等的部分。每边的积分相同,但质量作用不同。后者由第一个原始时刻(或期望值或平均值)给出

m=x1p(x)dxx0p(x)dx

第一个中心矩为零:

(x1mx)p(x)dx=0