双变量和多变量分布关系。
如果我们说 3 个变量,其中任何两个变量服从正态二元分布,那么它是否一定服从多元正态分布?
双变量和多变量分布关系。
如果我们说 3 个变量,其中任何两个变量服从正态二元分布,那么它是否一定服从多元正态分布?
这是一个反例:
令 , ,为独立标准法线,令。
那么、和是二元正态,但不是三元正态,因为永远不会是负数。
正在发生的事情是已经构建了三元分布,因此概率仅在八个八分圆中的四个中,这样成对边缘的每个象限都得到一个有概率的八分圆和一个没有概率的八分圆。
为了帮助可视化正在发生的事情,请参阅以下模拟:
x=rnorm(1000)
y=rnorm(1000)
z=rnorm(1000)
w=abs(z)*sign(x*y)
以下是成对样本:

这是当被限制为正和的样本二元分布:

(当被限制为负时,值在其他两个象限中)
这是三元分布的特定投影;例如,您应该能够确定底部有一个低密度的“间隙”。

这似乎是一个有点人为的反例,但仅在一些奇怪的边缘情况下就不是问题。更一般地,三元分布可能与三元正态分布完全不同,以任意数量的平滑或非平滑方式。三个以上的变量也是如此。
Copulas 为我们提供了一种构建具有各种特征的此类反例的无穷大的方法。
不。理论上,@Glen_b 的答案之类的例外情况可能适用。
在实践中,多元正态性部分取决于变量遵循其正态单变量/双变量分布的精确程度。毕竟,很少有任何实际分布恰好具有零偏度和零超峰度。因此,如果您推断所有双变量分布都是正态的,因为您未能拒绝对每个变量进行多元正态性检验的零假设,那么如果双变量结果,对所有三个变量进行相同检验的结果可能刚好超过您的拒绝阈值都是和你的。如果您已经通过正态性显着性检验避免了此类问题,则此答案可能对您无关紧要但是,并且通过更好的方法确定您的变量是正态分布的(无论是精确还是足够接近)。
即便如此,在实践中,人们可能会发现数据子集表现出像 Glen_b 示例中那样有问题的关系。与双变量正态性的可接受偏差,一旦与此类多变量问题的有限实例混合,可能会超出您的目的对非正态性的容忍度,这在大多数实际样本数据中必然会在某种程度上出现。