如何从已知均值和标准差的正态分布中计算样本分位数的标准误差?

机器算法验证 标准错误 分位数
2022-04-01 21:58:43

我知道 iid 样本的平均值的标准误差计算为

σn

但是,假设具有已知均值和标准偏差的正态分布,您如何计算任意分位数的标准误差?

例如,假设

  • 正态分布
  • 总体平均值 = 0
  • 总体标准差 = 1
  • n=100
  • 分位数 = .95

这个分位数的标准误差是多少?


我运行了这个小模拟来探索属性,但我仍然对封闭形式的解决方案感兴趣:

set.seed(1234)
generate_x <- function(n) x <- rnorm(n)
k <- 10000
n <- 100

results <- lapply(seq(k), function(X) generate_x(100))

Z <- seq(.01, .99, .01)
qresults <- sapply(results, function(X) quantile(X, Z))

sd_quresults <- apply(qresults, 1, sd)
var_quresults <- apply(qresults, 1, var)

plot(Z, sd_quresults, type='l')

在此处输入图像描述

2个回答

这至少为这个问题提供了一些指示和部分答案。

在样本分位数的情况下,标准误差取决于您实际使用的样本分位数的定义。例如,我相信 R 在其quantile函数中包含 9 种不同的分位数定义。

对于样本分位数是精确顺序统计量的情况,样本分位数的标准误差遵循该顺序统计量的标准误差。

如果分位数基于二阶统计的某个加权平均值,则可以从它们的方差、协方差和权重中获得标准误差。

结果,可以形成置信区间;在分位数是顺序统计量的情况下,二项分布可用于直接从顺序统计量形成非参数区间。

在我的理学硕士期间参加定量金融课程时,我遇到了计算正态分布样本分位数的标准误差的问题。与这个问题相关的主要话题是对风险价值的分析。这是封闭形式的解决方案:

s.e.(z^α)=σ1n1+2zα2(n12Γ2(n/2)Γ2((n1)/2))
不幸的是,到目前为止,我无法为您提供任何证明参考。