我们正在模拟一个离散的选择场景,具有替代特定的系数。我们还打破了无关选择独立性的假设。为了对此建模,我们使用了一个特定于替代的多项概率回归。这在 Stata 中实现为asmprobit. 但是,如文档中所述,替代品的数量有限制:20!我们每箱最多有 120 种替代品!哦哦。
为什么会有这个限制?有什么可以做的来增加它吗?这个模型(或一个好的替代方案)是否在 R 或其他地方实现,大概没有这个限制?
我们正在模拟一个离散的选择场景,具有替代特定的系数。我们还打破了无关选择独立性的假设。为了对此建模,我们使用了一个特定于替代的多项概率回归。这在 Stata 中实现为asmprobit. 但是,如文档中所述,替代品的数量有限制:20!我们每箱最多有 120 种替代品!哦哦。
为什么会有这个限制?有什么可以做的来增加它吗?这个模型(或一个好的替代方案)是否在 R 或其他地方实现,大概没有这个限制?
主要问题asmprobit是它提供的灵活性放宽了不相关替代 (IIA) 假设的独立性,但它是以增加计算能力为代价的。从这个意义上说,您允许选择一个替代方案而不是其他替代方案的几率取决于剩余的替代方案,尽管这涉及对多元正态分布的概率进行评估。由于没有封闭形式的解决方案,您必须依赖模拟技术。这就是瓶颈。
用于求解模拟最大似然的模拟方法asmprobit是 Geweke-Hajivassiliou-Kean 多元正态模拟器(GHK 文档),它只允许维度。这就是限制来自的地方,因为对于更多替代方案,模拟时间变得无法控制。有关这方面的详细说明,您还可以查看文档“方法和公式”部分中的“模拟似然”部分。asmprobitasmprobit
鉴于限制的原因是计算原因而不是与实现有关的原因,我不会对 R 中更好的估计例程抱有太大希望。如果有一个,那么 Stata 现在可能已经实现了它。顺便说一句,mprobit出于与上述相同的原因,此限制对于离散选择的其他概率模型(例如,允许最多 30 个不同的选择)也是一个问题。
对您有用的参考应该是
这可能是该主题的主要参考资料。如果我没记错的话,他还讨论了选择数量非常大的情况。但是,我不确定您是否可以两全其美,即放松 IIA 并允许许多替代方案。当然,由于多元正态分布,概率模型不会让您走得太远,但也许其他也放松 IIA 假设的模型可能有用。例如,混合 logit 模型也放宽了这个假设,因此可能值得看看 Stata 选项来估计这些类型的模型(例如,请参阅此演示文稿以获得概述)。