变量之间的依赖关系可以从数据中推导出来吗?如果是这样,怎么办?

数据挖掘 机器学习 数据挖掘 多元分布
2022-03-04 17:38:40

我有一个数据集X其中包括m矢量图xn实值成分。每个向量分量位于相应的预定义有效值区间内,对于X. 假设是每个向量的分量之间存在一个依赖图,对于所有向量也是一样的;例如组件的值xk(也许)取决于两个组件的值xpxq对全部xXkpq. 但是,我们不知道该图的确切结构。换句话说,我们假设每个数据点的变量之间存在依赖关系,但我们不知道它是如何构造的。所以问题是只使用可用的数据来推断这个依赖图X.

我的问题是:有没有一种方法或算法可以让我解决这个问题?如果是这样,有人可以指出我可以了解更多信息的来源吗?

1个回答

是的,我们可以做到。我们可以通过相关度量来衡量两个变量之间的线性关系,以了解更多信息如果您想确定两个以上变量之间的线性关系,我们可以通过 VIF 分数来实现。如果一个变量的 VIF 分数大于 5,我们可以说这个变量可以表示为其他变量的线性组合,以了解更多信息如果你想在 python 中实现考虑这个