最小二乘中的常数会发生什么

机器算法验证 回归 最小二乘 算法
2022-04-09 11:29:33

预赛

为简单起见,假设我们正在处理示例的二维数据集(xi,yi)R2它们分为训练集(已知对象及其标签)和测试集(仅已知对象)。

可以使用以下矩阵过程表示使用最小二乘法的预测:

  1. 从我们的训练集中找到最佳回归常数 w=YX(XX)1
  2. 将上述内容应用于测试集中的连续未标记示例以找到它们的标签y^=wx=YX(XX)1x

问题

完成上述过程的第 1 部分后,如何找到最佳线性最小二乘线?

如果可以使用线性线表示y=wx+c你如何找到常数c?

1个回答

通常在教科书和文献中,作者会在数据矩阵中隐含地添加一个1 的常量列X. 如果你的原始向量x好像

x=[56163]

然后你的增强X是这样的

X=[56116131]

因此你的w向量实际上是一个二维向量:第一个分量表示x,第二个分量表示 1 的系数(在您的示例中,这表示为c.)

如果我们表示w=[w1,w0],那么,您的最佳最小二乘线由下式给出

y=w1x+w0