这是 BW Silverman 的用于统计和数据分析的密度估计的摘录:
最古老和最广泛使用的密度估计器是直方图。给定原点和的 bin 宽度,我们将直方图的bin 定义为整数。直方图定义为
既然我看到了,这是否意味着我们正在谈论一个估计器?我也不明白公式。我不确定从到的切换,我只是假设它们是同一件事。
这是 BW Silverman 的用于统计和数据分析的密度估计的摘录:
最古老和最广泛使用的密度估计器是直方图。给定原点和的 bin 宽度,我们将直方图的bin 定义为整数。直方图定义为
既然我看到了,这是否意味着我们正在谈论一个估计器?我也不明白公式。我不确定从到的切换,我只是假设它们是同一件事。
正如@tristan 评论,是一个计数器整数,而是样本中数据点的总数,是直方图 bin 宽度。公式是正确的。
如果您考虑有个 bin 并且每个 bin 中有相同数量的数据点的情况,可能会更容易理解。那么你的直方图高度对于每个 bin 都是相同的,。所以你有个箱子,每个箱子的宽度为和高度,总面积为 1。密度应该是。
事实上,如果你计算每个 bin 中的数据点,你会发现你的直方图的总面积总是1。再说一遍:这正是密度应该是什么。
是的,是一个估计量。它是在阶跃函数空间中的密度估计。您可以使用阶跃函数逼近大多数“正常”函数(从某种意义上说,阶跃函数与要逼近的函数之间的绝对差的积分在变为零),因此阶跃函数是一种逻辑上的简单逼近.
事实上,直方图可以被视为与核密度估计器有关,“核”不仅依赖于,而且还依赖于:即“计算核”,它计算如何许多落入包含的区间(bin) 。这是查看直方图的一种有点做作的方式,但实际上我觉得它有点启发性。