自学正态线性模型:我能用它做什么?

机器算法验证 线性模型
2022-04-20 03:53:25

我目前正在自学正常的线性模型(),并且已经了解了估计,测试某些类型的假设(虽然不是太复杂的),创建置信区间,并进行预测(我的研究在数学上是严谨的,所以即使这些东西大部分在基础课程中都有解释,我的理解还是相当深入的)。XiN(Aβ,σ2I)βσ2

我的问题是,这个框架内的“下一步”是什么?我应该继续研究统计的其他部分,关注具有不同分布的其他模型,还是在正常设置中还有更多深度?除了我已经提到的事情之外,我很难弄清楚我还能从中得到什么。

1个回答

这绝不是权威,但希望它能给你一个开始的地方。

您已经研究了模型Y=Xβ+εεN(0,σ2I)

这个模型有很多扩展。有些是:

  1. 探索关于的不同假设。也许你只假设 ,如果会发生什么?如果是对角线,则可以得到加权最小二乘;如果甚至不是对角线,那么您可以使用广义最小二乘法此外,如果指定了正态分布但没有指定正态分布(例如,拉普拉斯),会发生什么?事实证明,这与考虑平方损失以外的损失函数密切相关。εE(ε)=0Var(ε)=DDσ2InDDε
  2. 考虑的其他分布。这可能导致GLMYi
  3. 探索惩罚回归。这是一个很大的区域。我将从套索岭回归开始。
  4. 岭回归和套索涉及调整参数。这将引导您了解交叉验证或者,您可能更喜欢使用 AIC 和 BIC 等信息标准。这里有很多东西要研究,例如它们的确切来源以及与不同类型交叉验证的渐近关系。显着性测试也变得棘手。也许您需要更频繁地使用引导程序。
  5. 岭回归和套索也有贝叶斯解释。这可以引导您进入完整的贝叶斯并研究各种先验和多级模型的影响。这可能需要使用MCMC,这本身就是一件大事。
  6. 与前一点密切相关的是令人愉快的混合效应模型世界,它也与广义最小二乘法密切相关
  7. 也许您有连续的预测变量并想在其中使用多项式,但您不喜欢全局多项式。您可以考虑像样条线这样的基础扩展方法。我建议您看一下统计学习的要素(可在线免费获得)。
  8. 从这里你可以学习一般的内核方法;这包括像支持向量机这样的方法。

现在,您已经拥有了两种简单的可解释工具,如 iid 正态误差线性回归、非参数灵活方法(如 SVM),以及介于两者之间的许多东西。