我很难找到一种确定的方法来确定我是否可以在多元线性回归中使用百分比度量作为自变量。
据我了解,由于某种原因,该百分比不能被视为真正的连续度量,并且违反了回归模型的某些假设。
编辑1:例如,我看到百分比数据是离散的,因为计算百分比的基础数据是离散的。
有人可以解释为什么百分比不是真正的连续测量,在什么情况下我可以使用百分比作为自变量?
编辑2:为了更清楚起见,我将在下面解释我希望具体完成的工作。目标是使用一个因变量(时间长度)并声称它由几个自变量解释(一些虚拟变量,一个百分比,不限于任何观察的任何特定值)。我知道线性回归的假设是自变量将是连续测量,这就是为什么我将虚拟变量用于二分分类变量。我只是想确保我不需要完全使用不同的分析技术,因为百分比在技术上是离散的(这甚至一定是真的吗?)。
编辑3:为了完全的特异性,
DV - 休产假的长度。IV's - 休假期间雇主支付的正常工资的百分比,以及与问题无关的其他虚拟变量。