机器算法验证 - 使用引导程序计算必要的样本量 - 吾爱随笔录

使用引导程序计算必要的样本量

机器算法验证引导程序样本量

2022-03-24 11:37:51

我最近遇到了一个网站 (http://www.surveysystem.com/sscalc.htm)，它返回给定以下输入的样本量：置信水平、置信区间和总体。我假设这是通过在 CDF 下重新安排假设检验来完成的，我猜是使用标准正态分布？但是，如果人们不相信数据反映了这个特定的 CDF，您将如何使用自举来获得数据驱动的样本量版本，并且不限于 ~N(0,1) 分布？

此外，我对这个样本分层程序感兴趣。

对任何一个，尤其是第一段的帮助，将不胜感激。

2个回答

好的，所以根据您的问题的详细信息，这个答案可能不完全是您所追求的，但我只是根据标题偶然发现了您的问题，因此这可能会帮助其他以类似方式遇到它的人。

我知道使用引导程序确定样本量的唯一方法是通过功率分析方法。那是你：

陈述原假设和备择假设
说明 alpha 水平（通常为 5%）
如有必要，转移试点研究数据，以便您知道零假设是错误的
使用来自试点研究的替代品重新取样
对此样品进行测试并记录结果
重复 1000 次左右以建立概率分布
计算拒绝原假设的次数

有许多可能的“...主题的变体”

这为您提供了统计功效（对于该样本量和该特定测试），因为统计功效的定义是“当备择假设为真时，该测试将拒绝原假设的概率”。因此，您可以改变样本大小，直到达到所需的功效。

这是我根据 Elizabeth Colantuoni 撰写的这篇论文 Sample Size / Power Considerations 在 R 中采用的一种方法。

我有两组非正态、非参数数据。对每一个的初步研究表明它们具有不同的中位数，Mann Whitney Wilcoxon 检验拒绝了它们相同的零假设，但我想确定所需的样本量，所以我可以“肯定”地说。由于测试已经拒绝了试验数据的原假设，我认为没有必要改变或操纵数据以确保替代假设为真。

power = function(group1.pilot, group2.pilot, reps=1000, size=10) {
    results  <- sapply(1:reps, function(r) {
        group1.resample <- sample(group1.pilot, size=size, replace=TRUE) 
        group2.resample <- sample(group2.pilot, size=size, replace=TRUE) 
        test <- wilcox.test(group1.resample, group2.resample, paired=FALSE)
        test$p.value
    })
    sum(results<0.05)/reps
}

#Find power for a sample size of 100
power(data1, data2, reps=1000, size=100)

必要的免责声明：我不是统计学家，我仍在学习引导，因此欢迎反馈、更正以及指点和笑声。

假设您要计算基于非正态的测试（例如 wilcox 测试）的功效，一种通用方法是模拟。用于功率计算的 bootstrap 的基本方法是假设效果是实际计数多少次，所选择的统计检验基于在您运行模拟的总次数上选择的显着性水平给出统计显着性结果。这个比例就是功率。

对于 Wilcox 测试，以下 R 代码显示了该方法的原理。

power = function(group1, group2, alpha=0.05, reps=1000) {
    results  <- sapply(1:reps, function(r) {
        group1.resample <- sample(group1, size=length(group1), replace=TRUE) 
        group2.resample <- sample(group2, size=length(group2), replace=TRUE) 
        test <- wilcox.test(group1.resample, group2.resample, paired=FALSE)
        test$p.value
    })
    sum(results<alpha)/reps
}

where data1 and data2 are assumed to be vectors for simplicity.
power(data1, data2, reps=1000)

基于这种方法，还应该清楚如何将该方法扩展到更一般的实验设置，例如配对数据或更多组等。统计中许多主题的简短概述，包括助推，可以在 Larry Wasserman 的优秀书籍中找到“所有统计数据”。

就进一步的稳健统计而言，强烈推荐 Rand Wilcox 的书“稳健估计和假设检验简介”，在查看源代码以了解其工作原理方面也非常有用（鉴于他的 WRS 包包含大约 1000+功能左右）。

顺便说一句，在我看来，这可能是有用的，您可能已经完成了实验，这会导致事后功率分析的问题。

其它你可能感兴趣的问题

上一篇解释置信区间。下一篇使用 Octave 的简单多元回归