我正在对 400 名受访者的总体样本运行 Pearson 相关性。
当我分离出男性和女性的反应时,我的样本变成了 220 个男性反应和 180 个女性反应。
如果我进一步按(例如)年龄组分离男性和女性的反应,一些样本量会低至 35 个反应(例如,对于 65 岁以上的女性)。
我的问题:这些样本量对相关性分析有多好?(我正在研究收入水平和海外旅行之间的关系。)
(我认为这与误差幅度有关,但这如何适用于基于概率的推理分析。我可以理解它在描述性统计中的作用,例如政治民意调查的结果)。
我正在对 400 名受访者的总体样本运行 Pearson 相关性。
当我分离出男性和女性的反应时,我的样本变成了 220 个男性反应和 180 个女性反应。
如果我进一步按(例如)年龄组分离男性和女性的反应,一些样本量会低至 35 个反应(例如,对于 65 岁以上的女性)。
我的问题:这些样本量对相关性分析有多好?(我正在研究收入水平和海外旅行之间的关系。)
(我认为这与误差幅度有关,但这如何适用于基于概率的推理分析。我可以理解它在描述性统计中的作用,例如政治民意调查的结果)。
当涉及到样本量时,越大越好,但我们经常不得不采取我们得到的东西。对于较小的样本量,您对相关性的估计将变得非常嘈杂,并且不同估计之间的比较(我希望这是您在子集分析中的主要目标)将特别嘈杂。
这个关于标准误差的在线教程(作为 pdf 格式)包含相关系数的 SE 公式(以及相关性的 Fisher 变换,这是测量 SE 的更好尺度)。你会看到比例大约是.
对于约 0.5 的相关性,样本量为 200 的 SE 约为 0.06;样本量为 50 时,它将是大约两倍。