从数据输入创建预测公式

数据挖掘 机器学习 预测建模
2022-03-07 19:39:37

我有一个算法,它有大约 20-25 个数字作为输入。然后在每一步中,它使用其中一些数字和随机函数来计算局部结果,这将导致 A、B 或 C 的最终输出。

由于每一步都有一个随机函数,所以公式不是确定性的。这意味着使用相同的输入,我可以有 A、B 或 C。

我的第一个想法是逐步采用算法并以数学方式计算每个输出的概率。但是,由于核心的大小,这确实很困难。

我的下一个想法是使用机器学习和监督算法。我可以有尽可能多的标签条目。

所以,我有以下问题:

  1. 我需要多少标记输入才能获得合适的概率方法?是的,我想拥有多少就拥有多少,但运行算法需要时间,而且我想估计收集标记数据的模拟成本。
  2. 您建议哪种技术适用于如此多的输入,可以给出三种可能输出的概率?
  3. 作为一个额外的问题,该算法分 10 个步骤运行,并且某些输入可能会在其中一个步骤中发生变化。我的简单方法是不在预测公式中包含此选项,因为我必须为某些步骤设置不同的输入。如果我尝试高级方法,还有其他我可以使用的技术吗?
1个回答

我不确定我是否理解你的问题!至少最好制定一个计划。但根据我从你的问题中猜到的:

Q2-您可能需要一个简单的MLP(多层感知器)!这是一种传统的神经网络架构,其中有输入神经元(此处为 20-25)、一个或多个具有多个神经元的隐藏层和 3 个作为输出层的神经元。如果您使用范围从 0 到 1 的sigmoid激活函数,则每个类的输出将为nP(Y=1|X=x)

Q1-所以你的问题可能是:学习模型需要多少训练数据?据我所知,答案是尽可能多的

关于最后一个问题,我真的不明白你的意思。你显然有一个非常具体的任务,所以我建议为了澄清起见分享更多的见解。

我希望我能帮上一点忙!