我知道如何在 Excel 和 R 中生成 Pearson 的相关值。
我理解该值的含义,因为它的范围为
我也了解假设检验、置信区间和值。( = 该结果是由于随机机会或自然变化造成的概率,并且零假设为真)
但是,我无法在 Pearson 的相关性和值之间建立联系。在假设检验中,存在一些结果变化的机会因素(如掷硬币)。但是,在回归中,它基于实际数据点。那么 p 值在这种情况下意味着什么?数据点只是由于随机机会而聚集的可能性?这直接基于样本量吗?我问是因为我想知道一个公式如何知道离散数据点的可变性(例如汽车的售价和里程)。
那么,对于 r 值,p 值是基于样本大小的吗?我不明白的是 p 值似乎回答了一个二元问题:是否有影响?但是对于相关系数,没有提出是/否的问题。
如果我得到一个 r = .8 和 0.20 的 p 值,那是什么意思?这意味着 0.8 的相关性不正确的可能性为 20%?但是,什么是真的?r=.7 ? r=.6?
还是经验法则是,如果 p < .05 ,您只能使用 r 值,而不管数字如何?
如果我得到一个 r = .1 和 0.0001 的 p 值,那是什么意思?我们非常有信心存在非常弱的相关性?(多讽刺?)
如果我得到一个 r = .5 和 0.0001 的 p 值,这意味着什么?我们非常有信心存在适度的相关性?
如果我得到一个 r = .5 和 0.3 的 p 值,那是什么意思?这意味着有 30% 的机会存在 0.5 的中等相关性?