解释模型的回归模型(详情见内)

数据挖掘 机器学习 逻辑回归 预测建模 回归
2022-03-11 11:52:14

我是机器学习的新手,我想根据我遇到的问题提出一些问题。

假设我有 xyz 作为变量,并且随着时间的推移我有这些变量的值,例如:

t0 = x0 y0 z0
t1 = x1 y1 z1
tn = xn yn zn

现在我想要一个模型,当它给出 x 、 y 、 z 的 3 个值时,我想要对它们进行预测,例如:

输入:x_test y_test z_test 输出:x_prediction y_prediction z_prediction

这些值是浮点数。解决此类问题的最佳模型是什么?提前感谢所有答案。

更多细节:好的,让我提供有关问题的更多细节,以便更具体。

我已经运行了某些基准测试,并在每个时间间隔从系统核心获取了性能计数器的值。

性能计数器是上面示例中的 x 、 y 、 z 。它们相互依赖。简单的示例是 x = IPC , y = Cache misses , z = 核心能量。

所以我得到了每个时间间隔所有这些性能计数器的数据集。我想做的是创建一个模型,在从训练数据集中学习后,它将被赋予核心的某种状态(性能计数器)并预测性能计数器核心将在下一个间隔中拥有。

2个回答

AFAIK 如果你想预测一个变量的值,你需要有一个或多个变量作为预测变量;即:您假设一个变量的行为可以用其他变量的行为来解释。在您的情况下,您有三个要预测其值的自变量,并且由于您没有提及任何其他变量,因此我假设每个变量都依赖于其他变量。在这种情况下,您可以拟合三个模型(例如回归模型),每个模型都可以根据其他变量预测一个变量的值。例如,要预测 x:

x_prediction=int+cy*y_test+cz*z_test

,其中 int 是截距,cy、cz 是线性回归的系数。同样,为了预测 y 和 z:

y_prediction=int+cx*x_test+cx*z_test
z_prediction=int+cx*x_test+cy*y_test

好的,所以时间 t-1 的值预测时间 t 的值。这就说得通了。

首先,您应该确定您是否认为这些值是独立的。x 是否预测 y 或 z?而且,您认为只有前一个 1 值是预测性的,还是前一个 n?

无论哪种方式,您都可以将其建模为一个简单的回归问题。哪种技术最好实际上取决于您期望的关系是什么,以及这些变量是什么;我不确定这里给出的。

例如,如果它们的传感器值读取速度相当快,并且传感器变化缓慢,那么您会期望一些简单的模型(如移动平均线)表现良好。对于其他类型的值,这根本无法预测。

这看起来像马尔可夫链模型,所以你可以研究一下,但不知何故,我认为它对于我认为的问题来说过于笼统了。