我知道零膨胀模型背后的一般思想,并使用了零膨胀泊松和负二项式。但是,我目前拥有的数据格式略有不同,这让我认为这些可能不是好的选择。
因变量是体重增加。然而,数据被截断为 0,因此任何体重没有增加的人都被标记为“体重没有增加”。其他人的体重都增加了磅。我可以将此视为负二项式计数,因为体重增加四舍五入为整数磅,但这似乎不正确,因为变量基本上是连续的。
零膨胀高斯是否适合/甚至可能?有谁知道这种模型在 R 中的实现?
我知道零膨胀模型背后的一般思想,并使用了零膨胀泊松和负二项式。但是,我目前拥有的数据格式略有不同,这让我认为这些可能不是好的选择。
因变量是体重增加。然而,数据被截断为 0,因此任何体重没有增加的人都被标记为“体重没有增加”。其他人的体重都增加了磅。我可以将此视为负二项式计数,因为体重增加四舍五入为整数磅,但这似乎不正确,因为变量基本上是连续的。
零膨胀高斯是否适合/甚至可能?有谁知道这种模型在 R 中的实现?
我认为该模型更适合左删失高斯,因为您描述的过程是关于丢弃低于某个值的信息(在这种情况下,该位置已知为 0,这比未知删失值的情况更简单) . 换句话说,有一些可以(假设)测量的真实数量,但该数量没有记录。我们需要使用一种建模工具来反映存在一些真实的、未经审查的值,但我们无法获得该值。
我的书架上碰巧有一个资源是 Gelman 等人的贝叶斯数据分析(第 3 版)。从第 224 页开始讨论审查和截断模型。作者写道
假设一个物体在具有已知测量分布的电子秤上称重 100 次,其中是物体的真实重量......
[T] 秤的报告上限为 200 公斤:所有超过 200 公斤的值都被报告为“太重”。完整的数据仍然是,但是观察到的数据被删失了;如果我们观察到“太重”,我们知道它对应于读数高于 200 的称重。
这与 OP 所述的问题非常相似,不同之处在于它被审查为高于 200 而不是低于 0,并且每个项目都被反复称重并带有一些仪器错误的概念。
一个似乎相关的 R 包是censReg.
阿恩·亨宁森。“在使用包中估计删失回归模型censReg”
我们演示了如何使用附加包在 R 中估计审查回归模型(包括标准 Tobit 模型)
censReg。该软件包不仅为横截面数据提供了通常的最大似然 (ML) 程序,而且还为使用 Gauss-Hermite 求积的面板数据提供了随机效应最大似然程序。
我没有使用过它,所以我不能保证它在这个问题上的质量或实用性。可能还有很多其他选择。贝叶斯数据分析中采用的方法是编写自己的模型,或者使用基础库,或者使用stan. 这具有最大程度的灵活性,代价是必须自己进行编码。