使用 1 到 10 尺度因变量的回归类型是什么?

机器算法验证 回归 物流 民意调查 有序的logit
2022-03-14 21:18:49

我对分析有点陌生。我有这个具有以下属性的调查数据集。

自变量:

  • 一个。我们值得信赖吗?(值:1 到 10)
  • 湾。我们是否提供您需要的解决方案(值:1 到 10)
  • C。我们是否积极主动(值:1 到 10)
  • d。我们是否提供一致的服务质量(值:1 到 10)
  • e. 我们是否提供卓越的服务(值:1 至 10)

因变量:

  • 您将我们推荐给其他人的可能性有多大?(值:1 到 10)

这里我想做一个DV和IV之间的回归。以前我用 R 语言对二项式结果和连续 IV 进行了逻辑回归。但这种情况完全由序数数据组成。

我怎样才能回归这些数据并找到一些关系?请分享您对解决此问题的有用技术的想法。除了回归,还有其他方法吗?

4个回答

这是使用带有函数(有序因子响应)的R包的示例,该函数可以使用逻辑链接或概率。 MASSpolr

library(MASS);
recmodel=polr(recom~trust+solutions+proact+qs+es,data=surveydata,method=c("logistic"));  
summary(recmodel);  

我认为重要的是要R注意所有变量都是有序的,这意味着它不能将它们用作区间变量。

推断可以作为与某些基线的比较来完成。例如值 1 可以是这样的。

1)从调查中的问题来看,多重共线性的可能性很高。在考虑运行回归之前,您绝对应该检查预测变量之间的相关性和 VIF。

2)除了回归并且以听起来简单化为代价,我建议你做一些汇总统计和探索性分析。a) 每个问题的回答分布如何?b) 根据对单个问题的响应,响应变量如何移动。例如:在问题 2 中评分介于 5 和 7 之间的人中,有多少百分比表示他们可能(评分高于 7)向他人推荐?

描述性分析将可视化并为您需要进行回归分析的方向提供良好的方向。

正如评论中所指出的,因变量可以用序数 logit 处理。对于自变量,最灵活的方法是将每个变量转换为 10 个虚拟变量(假设您从模型中删除常数)。解释会有点混乱,但你没有对自变量强加任何函数形式假设。

您还可以尝试简化排序约束的刻板印象逻辑回归模型(一种降阶广义线性回归模型)(无需恢复为多项逻辑回归模型,该模型具有十个结果级别将呈现大量参数可能会妨碍您解释 tee 数据中关系的能力)。排序的约束依赖于比例优势假设,在使用序数回归模型时,在某些情况下可能会违反该假设。有关拟合刻板印象逻辑模型的示例,请参阅包?rrvglm中的示例。VGAM