机器算法验证 - 权重低于零的零膨胀高斯记录为 0？ - 吾爱随笔录

权重低于零的零膨胀高斯记录为 0？

机器算法验证回归负二项分布零通胀

2022-03-25 14:48:59

我知道零膨胀模型背后的一般思想，并使用了零膨胀泊松和负二项式。但是，我目前拥有的数据格式略有不同，这让我认为这些可能不是好的选择。

因变量是体重增加。然而，数据被截断为 0，因此任何体重没有增加的人都被标记为“体重没有增加”。其他人的体重都增加了磅。我可以将此视为负二项式计数，因为体重增加四舍五入为整数磅，但这似乎不正确，因为变量基本上是连续的。

零膨胀高斯是否适合/甚至可能？有谁知道这种模型在 R 中的实现？

1个回答

我认为该模型更适合左删失高斯，因为您描述的过程是关于丢弃低于某个值的信息（在这种情况下，该位置已知为 0，这比未知删失值的情况更简单） . 换句话说，有一些可以（假设）测量的真实数量，但该数量没有记录。我们需要使用一种建模工具来反映存在一些真实的、未经审查的值，但我们无法获得该值。

我的书架上碰巧有一个资源是 Gelman 等人的贝叶斯数据分析（第 3 版）。从第 224 页开始讨论审查和截断模型。作者写道

假设一个物体在具有已知测量分布的电子秤上称重 100 次，其中是物体的真实重量...... $\mathcal{N}(\theta,1^2)$ $\theta$

[T] 秤的报告上限为 200 公斤：所有超过 200 公斤的值都被报告为“太重”。完整的数据仍然是，但是观察到的数据被删失了；如果我们观察到“太重”，我们知道它对应于读数高于 200 的称重。 $\mathcal{N}(\theta,1^2)$

这与 OP 所述的问题非常相似，不同之处在于它被审查为高于 200 而不是低于 0，并且每个项目都被反复称重并带有一些仪器错误的概念。

一个似乎相关的 R 包是censReg.

阿恩·亨宁森。“在使用包中估计删失回归模型censReg”

我们演示了如何使用附加包在 R 中估计审查回归模型（包括标准 Tobit 模型）censReg。该软件包不仅为横截面数据提供了通常的最大似然 (ML) 程序，而且还为使用 Gauss-Hermite 求积的面板数据提供了随机效应最大似然程序。

我没有使用过它，所以我不能保证它在这个问题上的质量或实用性。可能还有很多其他选择。贝叶斯数据分析中采用的方法是编写自己的模型，或者使用基础库，或者使用stan. 这具有最大程度的灵活性，代价是必须自己进行编码。

其它你可能感兴趣的问题

上一篇参数化 Gamma 分布的等效方法下一篇如何确定用于 cox 回归（分类或连续）的最佳 BMI 形式？