我想了解两个信息熵值差异的含义。
我有以下情况。让X是用户在某些视频共享网站上花费的几个小时。因此,我们可能有以下集合:
X一种= {X1,X2, ⋯ ,Xn一种}, 和
XB={x1,x2,⋯,xnB}表示用户使用的小时数A和B在网站上花费A和B, 分别。
现在,我们可以计算累积分布函数
(CDF) 概率值,如下所述: 对于实值随机变量 X,CDF 定义为:
FA(x)=P(X≤x), ∀x∈XA
同样,我们发现FB(x).
然后我们计算熵值EA和EB对于概率 FA(x)和FB(x)上面获得(如此处所述):
EA=−∑i=1nAP(xi)log(P(xi))
同样,我们发现EB.
现在我的问题是,怎么办EA和EB在这种情况下是什么意思?它们的区别又意味着什么?