我通过使用 log10(在 R 中)然后减去特定的平均值并除以特定的标准偏差(给出对数的 z 分数)来标准化对数转换的数据。
这是一个前/后实验,所以我使用前(基线)测量的平均值和标准差来标准化这两个测量。
如果我计算前组和后组原始数据的平均值,我会得到积极的后效应(后的平均值大于前的平均值)。但是,如果我应用这种标准化,我会得到负面影响。我做的转换不正确吗?
谢谢您的帮助。
我通过使用 log10(在 R 中)然后减去特定的平均值并除以特定的标准偏差(给出对数的 z 分数)来标准化对数转换的数据。
这是一个前/后实验,所以我使用前(基线)测量的平均值和标准差来标准化这两个测量。
如果我计算前组和后组原始数据的平均值,我会得到积极的后效应(后的平均值大于前的平均值)。但是,如果我应用这种标准化,我会得到负面影响。我做的转换不正确吗?
谢谢您的帮助。
虽然通过单调变换保留了观察的顺序(以及因此分位数的顺序) - 因此,如果中位数或上四分位数在取日志之前按一个方向排序,并通过一个共同的位置和比例进行标准化,那么它们之后将在同一个方向上。
然而,在单调变换下,平均值不限于保持相同的顺序。方向互换是完全可能的。
[共同位置和尺度值的标准化不会改变相对均值......交换都是由于非线性变换。]
考虑两个样本,每个样本有两个观测值:
Mean Mean-of-logs
Sample 1: 1 10 | 5.5 1.15
|
Sample 2: 4 6 | 5.0 1.59
在原始尺度上,第一个样本的平均值较大(5.5 对 5)。在对数尺度上,第二个样本的平均值较大(1.15 对 1.59)。[这里我使用自然对数,但对数的底数无关紧要。]
您必须非常仔细地考虑您实际需要比较的是什么,而不仅仅是随意变换并希望无论您变换成什么规模的平均值都是有意义的。
但是,在某些情况下,您可以在转换后的比例上比较均值,并对原始比例做出一些结论。例如,如果在变换后的尺度上,除了位置偏移之外,两个分布是相同的,人口均值的差异(如果存在均值,则应该是所讨论的位置偏移)确实意味着原始尺度上的分布排序,在这种情况下,原始规模人口意味着——如果它们存在的话——也将采用相同的顺序。
(您会注意到,我的示例通过故意使价差完全不同来进行操作,并且具有稍大的均值与更大的价差;这样,日志会拖下最小的观察值并拉入最大的观察值,而不是相应的观察值。样本分布越少。这是一种在不同尺度上进行均值交换的简单方法)
但是,如果您有前数据和后数据,则可能您有配对数据。在这种情况下,您应该处理一些变化。您需要弄清楚哪种变化措施最适合您的情况。
如果您对绝对变化感兴趣,那么配对差异(post-pre)会很有意义。如果您对相对变化感兴趣,则比率或对数比率可能有意义(post/pre 或 log(post/pre) )。(尽管您的应用领域中的约定也将是一个考虑因素,但很难用这么少的信息给出准确的建议。)