最近,我学习了开放课程 CS229,
http:
//cs229.stanford.edu/notes/cs229-notes1.pdf
这位讲师介绍了一种梯度下降的替代方法,称为“Normal Equation”,方程如下:
正规方程可以直接计算.
如果正规方程有效,为什么我们需要梯度下降?这两种方法之间的权衡是什么?
最近,我学习了开放课程 CS229,
http:
//cs229.stanford.edu/notes/cs229-notes1.pdf
这位讲师介绍了一种梯度下降的替代方法,称为“Normal Equation”,方程如下:
正规方程可以直接计算.
如果正规方程有效,为什么我们需要梯度下降?这两种方法之间的权衡是什么?