在多元逻辑回归中,我需要标准化其中一个变量,因为我需要添加一个二次项。无论我将二次项添加为平方原始还是平方标准化,我都会得到非常相似的模型,相同的 AIC。为什么?线性项变化的估计。当我对标准化变量进行平方时,在对一半数据(负数)进行平方后得到正数,这应该会完全弄乱我的数据。为什么不呢?有人可以解释一下它背后的数学原因,并告诉我是否绝对应该使用平方原件,如果我可以使用平方标准化,为什么它会起作用?我注意到这是一个数学问题,而不是任何问题,但我搜索并找不到与此相关的任何内容。
添加二次项:我应该使用平方原始(而不是平方标准化?)
机器算法验证
物流
标准化
二次型
2022-04-09 14:04:52
1个回答
设变量为,均值为,标准差为,因此标准化变量为。通过扩展并收集的类似幂,您可以将模型重写为
其中是参数的函数,取决于常数和以及误差项 和以前一样。(其他多元回归项将保持不变且未显示。)这意味着一个模型将与另一个模型完全一样地拟合数据:任何差异都可归因于浮点舍入误差。(如果它们不是非常小,则可能存在巨大的共线性问题。)此外,如果估计过程在参数线性变化(即最大似然的情况,这是报告 AIC 时使用的情况)。
简而言之,您不必在对变量进行平方时对其进行标准化:即使它没有标准化,您也会得到一个等效模型。因为软件会在求解时自动标准化所有变量,所以您可以自由地以您认为最可解释的任何形式编写模型。
其它你可能感兴趣的问题