澄清概率质量函数 (PMF)

数据挖掘 机器学习 可能性
2022-03-09 12:57:57

我目前正在阅读深度学习书,我想更好地理解概率论。在《深度学习》一书的第 3.3.1 章中,指出

通常我们将每个随机变量与不同的概率质量函数相关联,读者必须根据随机变量的同一性而不是函数的名称来推断要使用哪个 PMF;P(x) 通常与 P ( y)。

后面的段落不多,它说如下:

概率质量函数可以同时作用于许多变量。这种在许多变量上的概率分布称为联合概率分布。P(x=x, y=y) 表示 x=x 和 y=y 同时出现的概率。为了简洁,我们也可以写成 P (x, y)

我很难掌握这两段。当他们说P(x)通常P(y). 据我了解,随机变量基本上是我们希望建模的现实世界中的随机现象。并且每个随机现象都有自己的概率质量函数。这是否意味着第一段表明随机变量y代表不同的现象,而在第二段中随机变量y代表相同类型的现象x,这就是为什么我们使用相同的概率质量函数?

提前致谢!

1个回答

我相信它们的意思如下:“我们将使用来表示概率质量函数 (pmf) 的概念是随机变量的 pmf ,而是随机变量的 pmf 。 _ _ _PP(x)xP(y)yxy

我认为混淆的主要来源是不是用来表示任何单个 pmf,而是用来指代 pmf 的名称。作为平行,height_of(Stefan) 和 height_of(Mark) 可能不同,也可能相同。height_of 只是我们正在测量的事物的名称,而不是事物本身。P

因此,P(x,y) 是联合变量 (x,y) 的 pmf。P((x, y)) 将是一个更明确的表示法,但我想为简洁起见将其省略。如果您需要更多关于联合变量的说明,请告诉我。我希望这有帮助。