社交网络数据经常以两种模式出现:人与他们参加的活动、人与他们参加的课程、国家与他们签署的条约等。分析此数据的策略是投影矩形二进制矩阵成一个模式矩阵。然后,新矩阵的每个单元格将具有人共同参加事件的次数。但是,他们共同参加活动的次数是否超出了偶然预期的次数?
我发现了一篇关于这个主题的有趣论文,它直接解决了这个问题。作者提出了这个 PMF,其中人和人恰好参加个事件的概率:

在一个相当小的网络中,计算这个没有困难。但是我有一个包含数千个节点的网络。分子和分母中的数字是巨大的。如此之大,以至于R只返回Inf而我得到一个毫无意义的结果。
我认为我应该做的是找到一种方法来近似这个 PMF。我还在考虑编写一些通过模拟近似分布的代码。有没有更好的方法来近似这个分布?是否有一些已知分布与所提出的理论分布非常接近(阅读。足够接近)?