我正在开展一个项目,调查由于移民而导致的工资增长。我首先使用概率模型根据各种特征预测迁移概率,从而纠正迁移决策中的内生性(只有那些最有可能从迁移中受益的人才会迁移)。然后,我在第二步中使用预测概率作为迁移的代理(这实际上是工具变量回归)。
我的问题是我得到了不合理的高估计——工资预计将增加 200%。我担心的是,由于我的预测概率非常低(平均为 3%,第 99 个百分位为 25%),这是合理的,因为样本中只有大约 5% 迁移,我得到的结果来自概率的边际增加从 0 迁移到 1。就我的样本中的预测概率而言,从 0 到 1 的增加是非常极端的。这会导致巨大的估计吗?我是否正确解释了这一点?还是我应该看我的乐器的强度等等?