我目前正在阅读深度学习书,我想更好地理解概率论。在《深度学习》一书的第 3.3.1 章中,它指出:
通常我们将每个随机变量与不同的概率质量函数相关联,读者必须根据随机变量的同一性而不是函数的名称来推断要使用哪个 PMF;P(x) 通常与 P ( y)。
后面的段落不多,它说如下:
概率质量函数可以同时作用于许多变量。这种在许多变量上的概率分布称为联合概率分布。P(x=x, y=y) 表示 x=x 和 y=y 同时出现的概率。为了简洁,我们也可以写成 P (x, y)
我很难掌握这两段。当他们说这P(x)通常与P(y). 据我了解,随机变量基本上是我们希望建模的现实世界中的随机现象。并且每个随机现象都有自己的概率质量函数。这是否意味着第一段表明随机变量y代表不同的现象,而在第二段中随机变量y代表相同类型的现象x,这就是为什么我们使用相同的概率质量函数?
提前致谢!