图中的随机变量是独立的吗?

数据挖掘 数据集 统计数据
2022-03-01 21:28:35

在此处输入图像描述

我有这个由 2 个随机变量组成的图(假设 X 和 Y)。对于给定的 X 值,一个点表示 Y 的值。我认为这些变量不能被认为是独立的。这是我的推理。

考虑 X = 0 时 Y 取的值。对于 X = 0,Y 可以取很宽范围的值(-4 到 8)。现在考虑 Y 在 X = 8 时所取的值。(仅 Y = 0)。由于 Y 的分布取决于 X 的值,因此这些变量不能被认为是独立的。我的推理正确吗?

1个回答

在概率论中,变量 A 和 B 之间的独立性定义为:

p(A)×p(B)=p(A,B)

这等效于这意味着事件 A 和 B 是独立的,前提是其中一个发生的机会完全不受另一个的影响p(A|B)=p(A)p(B|A)=p(B)

在此数据中,很明显两个变量单独的值更可能接近于零,因此(X btw 也是如此)。因此,当 X=8 时 Y 仅取值 0 的事实不一定与 X 相关,因为即使 Y 本身也更可能取值 0。换句话说,问题是是否等于所以推理是错误的,因为它没有考虑 Y 的个体分布,仅此一点就可以解释为什么它可能有 Y=0。p(Y=0)>>p(Y=8)p(Y=0|X=8)p(Y=0)

这可以更正式地计算,但我仅基于此图的解释是没有证据表明 X 和 Y 之间存在依赖关系。