密度估计和直方图

机器算法验证 直方图 估计者
2022-03-22 03:54:39

这是 BW Silverman 的用于统计和数据分析的密度估计的摘录

最古老和最广泛使用的密度估计器是直方图。给定原点的 bin 宽度,我们将直方图的bin 定义为整数直方图定义为x0h[x0+mh,x0+(m+1)h]m

f^=1nh(no. of Xi in the same bin as> x)

既然我看到了,这是否意味着我们正在谈论一个估计器?我也不明白公式。我不确定从的切换,我只是假设它们是同一件事。f^mn

1个回答

正如@tristan 评论是一个计数器整数,而是样本中数据点的总数,是直方图 bin 宽度。公式是正确的。mnh

如果您考虑有个 bin 并且每个 bin 中有相同数量的数据点的情况,可能会更容易理解。那么你的直方图高度对于每个 bin 都是相同的,所以你有个箱子,每个箱子的宽度为和高度,总面积为 1。密度应该是。MnMf^=1MhMhf^=1Mh

事实上,如果你计算每个 bin 中的数据点,你会发现你的直方图的总面积总是1。再说一遍:这正是密度应该是什么。

是的,一个估计量。它是在阶跃函数空间中的密度估计您可以使用阶跃函数逼近大多数“正常”函数(从某种意义上说,阶跃函数与要逼近的函数之间的绝对差的积分在变为零),因此阶跃函数是一种逻辑上的简单逼近.f^ h0


事实上,直方图可以被视为与核密度估计器有关,“核”不仅依赖于,而且还依赖于:即“计算核”,它计算如何许多落入包含的区间(bin) 。这是查看直方图的一种有点做作的方式,但实际上我觉得它有点启发性。xxihxxix