这是一个假设性且非常笼统的问题。抱歉,如果它太模糊。欢迎提出如何更好地集中注意力的建议。
假设您对一个内生变量之间的关系感兴趣和一些外生变量. 最终目标是预测新的实现鉴于新的认识的。你几乎不知道这种关系可以采取什么功能形式。
假设您有足够大的样本,以便您可以获得对联合概率密度的合理准确估计(通过核密度估计或类似方法)和的。
然后你可以使用
(A)核密度估计(或一些类似的替代方案);
(B) 机器学习技术(惩罚回归,如 LASSO、岭、弹性网;随机森林;其他)
(当然还有其他选择,但包括那些会使问题过于广泛。)
问题:
- 什么时候你更喜欢A而不是B,什么时候你更喜欢B而不是A?
- 选择的关键决定因素是什么?
- 我们面临哪些主要的权衡取舍?
随意评论特殊情况并添加您自己的假设。