是否有某种简单的方法可以计算效果大小为 2 个标准差的配对 t 检验所需的样本量?在我的工作中,我们经常使用平均值的 2SD 的效应大小来计算具有独立 t 检验的功效和样本量,但我不确定如何使其适应配对 t 检验。我什至不确定这种效应大小对于依赖 t 检验是否有意义。谢谢您的帮助。
配对 t 检验的临界效应大小和功效
是的,这是可能的,甚至相当容易,但需要额外的信息。具体来说,我们必须假设每对观察值之间的相关性是什么。
作为标准差单位差异的效应大小通常称为. 我们可以将校正因子应用于合并有关上述相关性的信息,然后我们可以使用我们的标准幂公式进行修正(确保还注意与移动到配对设计相关的自由度变化)计算能力。更正的是
这是一个小R程序,它根据假设的相关性和所需的功率电平计算最小 PAIRS 数量表,其中假定。
library(pwr) # package for pwr.t.test() function
# may need to install first with install.packages()
# define a function to get the minimum number of pairs
# for a given correlation and desired power level
getN <- function(r,p){
unlist(mapply(pwr.t.test, d=2/sqrt(1-r), power=p,
MoreArgs=list(n=NULL, sig.level=.05, type="paired"))["n",])
}
# apply this function to all combinations of the parameters below
tab <- outer(seq(0,.95,.05), c(.7,.8,.9,.95,.99,.999), "getN")
dimnames(tab) <- list("Correlation"=seq(0,.95,.05),
"DesiredPower"=c(.7,.8,.9,.95,.99,.999))
tab
它返回以下内容:
DesiredPower
Correlation 0.7 0.8 0.9 0.95 0.99 0.999
0 3.767546 4.220731 4.912411 5.544223 6.888820 8.656788
0.05 3.691858 4.126240 4.787326 5.389850 6.669683 8.350091
0.1 3.615930 4.031562 4.662220 5.235637 6.451021 8.044096
0.15 3.539645 3.936653 4.537050 5.081483 6.232774 7.738792
0.2 3.462940 3.841433 4.411750 4.927417 6.014903 7.434270
0.25 3.385708 3.745774 4.286234 4.773338 5.797404 7.130529
0.3 3.307922 3.649640 4.160447 4.619143 5.580267 6.827580
0.35 3.229382 3.552889 4.034209 4.464751 5.363362 6.525430
0.4 3.149970 3.455310 3.907393 4.309986 5.146613 6.224026
0.45 3.069435 3.356743 3.779777 4.154653 4.929824 5.923282
0.5 2.987581 3.256903 3.651065 3.998456 4.712773 5.623032
0.55 2.904079 3.155423 3.520841 3.841020 4.495111 5.323066
0.6 2.818472 3.051834 3.388672 3.681805 4.276260 5.022875
0.65 2.730145 2.945449 3.253781 3.520048 4.055501 4.721751
0.7 2.638237 2.835369 3.115118 3.354639 3.831565 4.418560
0.75 2.541442 2.720152 2.971074 3.183823 3.602697 4.111397
0.8 2.437713 2.597460 2.819127 3.004879 3.365682 3.796879
0.85 2.323340 2.463226 2.654597 2.812710 3.114890 3.468745
0.9 2.190677 2.309002 2.467897 2.596901 2.838233 3.113596
0.95 2.018024 2.110699 2.231866 2.327720 2.501567 2.692358
注意在许多领域被认为是相当大的影响大小,因此得到的最小对数都非常低。
任何效果大小都是可能的,很难说出“有意义”是什么意思。
互联网上有许多功率计算器,只需简单的 Google 搜索即可找到。您会看到这里经常推荐 G*Power。
从概念上讲,您或多或少地以相同的方式计算功率。在独立情况下,您可能正在使用条件的汇总方差来获得 SD。那是科恩的 D。但是,在重复测量的情况下,它将是效果的 SD,其中包含条件之间的协方差。如果您有合理的重复测量设计,则协方差应该相当大,这将导致较小的影响 SD。因此,您将需要一个较小的 N。您需要以某种方式找到这种效应 SD 或协方差(或相关性)。如果没有可从中推导出的重复测量研究,或者您没有先前的数据,您最好采用不同的方法(至少对于您的第一次重复测量研究)。
在进行研究之前,您不必计算功效。您可以采取以下方法。你可以决定你关心的效果有多大。假设它是 4(不是 4SD,在你的规模上是 4,不管它是什么......它甚至可能是你原来的 2 SD,尽管那相当大)。即使测试很重要并且您希望能够检测到至少该大小的影响,小于该值的影响也不会真正意味着什么。运行主题,直到您可以检测到该大小的效果(计算效果置信区间的宽度)。一旦您可以检测到所需的值,就停止。我之前发布的模拟结果表明这不会显着增加 alpha,并为您提供平均预期功率和 N。(请记住,您不是允许对测试的重要性做出决定,只有敏感性。这需要纪律。)