我有一组/一组论文(约 350 篇),这些论文被归类为非互斥类型的体内生物靶标,每一种都有不同数量的论文。对这些论文进行分类的另一种方法是施用一些针对目标的药物的方法。此分类的类别是互斥的。
我想比较生物目标类别的优点。我应该按生物学靶点或给药方法对论文进行分层,还是应该只取一个简单的随机样本?
同样,如果我要反过来——比较管理方法的优点——我应该如何取样?
最后,请记住评估每个类别的方法很费力,我应该使用多大的样本量?
我有一组/一组论文(约 350 篇),这些论文被归类为非互斥类型的体内生物靶标,每一种都有不同数量的论文。对这些论文进行分类的另一种方法是施用一些针对目标的药物的方法。此分类的类别是互斥的。
我想比较生物目标类别的优点。我应该按生物学靶点或给药方法对论文进行分层,还是应该只取一个简单的随机样本?
同样,如果我要反过来——比较管理方法的优点——我应该如何取样?
最后,请记住评估每个类别的方法很费力,我应该使用多大的样本量?
(1) 如果您可以对交付方式进行分层,请这样做。
(2) 如果你可以对目标进行分层,那么就这样做;提出一个有意义的分层策略,为您提供相互排斥的类别。(您必须详细说明这些类别如何重叠,以便我们提供有意义的建议。)
(3) 如果您可以对这两个变量进行分层,请在成对单元格上进行分层。
无论您产生什么分层,都要考虑分层之间的比例分配(除非您有理由期望某些感兴趣的变量具有与分层相关的某些行为)。也就是说,分层内的采样率应该是相同的:如果您决定希望样本大小为 50,那么您可能希望每个分层中的采样率为 1/7。这也意味着每个阶层在总体中应该至少有 14 个单位,这样您就可以对至少 2 篇论文进行抽样,另外还能够产生方差估计(您不能在一个阶层中仅使用 1 个观察值来做到这一点) )。因此,您可能必须合并太小的地层。
样本量问题完全取决于您。这是准确性和成本之间的权衡,而这两者可能只在您的脑海中。如果您只有一个感兴趣的目标变量,并且对您尝试捕获的效应大小有所了解,那么会有一种方法进行一些功效分析并尝试找出样本大小。如果您有多个响应变量并且不知道它们在您的论文群体中的表现,那么基本上您会想要抽样,直到您厌倦阅读这些论文。