我不会仅仅因为F^没有恒定的方差。如果您使用应该做得更好的加权 MSE……但是然后F^i和F^j也不是独立的。
一种可能性,如果你想F^尽可能接近F在类似 MSE 的意义上,您可能会尝试最小化 Anderson-Darling 统计量(因为它就像一个精确加权的 MSE)。
老实说,如果可行的话,我倾向于使用可能性来估计参数——但不是在 ECDF 上;您想处理数据并构建可能性(即查看数据值和f, 不是F和F^) 如果你区别回本质上是直方图†您应该能够从中获得良好的 ML 估计*。

→ 4 5 5 5 6 6 6 7 7 7 7 8 9 9 9 9 9 9 ...
*(如果由于离散化而略微近似)
†- 如果在只有ecdf 而没有 ecdf的情况下如何获得样本量并不明显n,让我明确一点。您似乎正在处理的情况(即“在适当精细的网格处”所暗示的那样)我们有一个精细离散的连续分布,如果我们有观察结果,我们仍然可以合理地将其视为连续分布。
考虑到在每个跳转点,ecdf 必须增加1/n.
它总是增加几倍的机会k/n(2/n或者3/n说)在每个跳跃点确实会非常小(一些简单的手工计算或模拟使这一点足够好)。所以我们可以 - 概率非常接近 1 - 推断出确切的n通过找到最大的1/n与 ecdf 的每一次变化一致。
[另一方面,在非常粗略的网格中使用非常小的样本,因此只会出现几个不同的值,您可以获得每个点的增加2/n也许3/n所以遇到问题,特别是如果你想要标准错误。因此,如果我们只有 4 个垃圾箱并且这些垃圾箱中的计数是 2、6、12、4,我们会得到n错误(看起来跳跃是 1/12 而不是 1/24 的倍数,所以我们认为ni是 1,3,6,2),因此标准误差 - 在某些情况下,甚至是点估计 - 可能是一个公平的方法。幸运的是,这个问题不是这样。]