我有一系列非负整数和设计矩阵,其中和为或,是交互作用,而是我们要估计的参数。例如,数据看起来像
y x1 x2 x1*x2
10 0 0 0
23 0 1 0
18 1 1 1
19 1 0 0
25 0 1 0
...
我想估计、、和系数并执行测试以查看是否有任何系数不为零。
有几种不同的回归模型可能适用于这种情况:
- 简单的线性回归:
lm - 泊松回归(当服从泊松分布时):家庭 = 泊松
glm - 准泊松回归(当过度分散时;这意味着):with family = quasi-poisson
glm - 负二项式回归(当过度分散时,):,在 MASS 包中。
glm.nb
我想问的问题是:
- 我应该如何为这个数据集选择模型?有没有办法根据我的数据集的一些描述性统计数据来选择正确的模型?
- 我应该如何检查和验证拟合的选定模型是否适合我的数据?