我正在尝试研究公司对某些特定化学品的污染输出的预测因素。我使用的数据有很多 0(即,公司根本没有用这些化学物质污染),然后是连续的,有一条长长的右尾。我已经看到其他人通过在添加 1 后记录因变量来对这些数据进行建模。我的感觉是这是错误的,但我不明白为什么。有人可以解释一下吗?这种方法比我认为我应该做的要简单得多——对半连续数据使用零膨胀的两部分模型——所以如果结果证明只是加 1 并且日志记录是正确的,我会很高兴。
其次,我找到了一个 Stata ado 文件来运行半连续数据的零膨胀两部分模型。有没有办法将固定效应合并到这种类型的模型中?