在我大学毕业之前,我有一个项目实际上是我作为政治家的研究援助。该项目也是我的毕业论文。我正在研究的报告部分侧重于确定新的燃油经济性立法对重型车辆的影响,例如 18 轮车或大型卡车及其司机。
我设法清理并整理了数据,但是当我进行回归时(使用年份、地区等的虚拟变量),我意识到我看到了警察和犯罪问题的实际作用:工资影响就业,从而影响工资等。事实上,我通过将工资和就业相互对照运行一次来检查回归,并且有一个非常显着的 p 值吐回给我,具有 99% 的 R 值——让我意识到我有一个问题。
我知道我需要找到一些只影响一个(工资或就业)但不影响另一个的变量。(在莱维特的论文中,他使用了选举,这会影响警察的存在而不是犯罪。)在我的工资/就业模型中,这将是什么类型的变量?是否有其他方法可以解决内生性问题?
如果需要,我可以发布数据,尽管我的问题比以数据为中心的问题更具概念性。