我了解平方损失,添加一个到目标函数将简化许多推导,因为平方的导数有一个常数.
我们是否在做与逻辑损失类似的事情?如果不是,为什么残余偏差是负对数似然的两倍?
几行代码来演示我的问题。
fit=glm(vs~mpg+hp+wt,mtcars,family = binomial())
p=fit$fitted.values
y=mtcars$vs
# these two values are the same
fit$deviance/2
-sum(y*log(p)+(1-y)*log(1-p))