我有一个数据集(var1, var2, out),其中有序对<var1, var2>给出out。大多数频繁模式挖掘算法,如 Apriori 和 FP 增长算法,都不会保留 var1 和 var2 的顺序。
有哪些可用的模式挖掘算法(也可能是 NN 技巧)来查找有序对<var1, var2>和输出变量之间的关联规则out?
谢谢。
我有一个数据集(var1, var2, out),其中有序对<var1, var2>给出out。大多数频繁模式挖掘算法,如 Apriori 和 FP 增长算法,都不会保留 var1 和 var2 的顺序。
有哪些可用的模式挖掘算法(也可能是 NN 技巧)来查找有序对<var1, var2>和输出变量之间的关联规则out?
谢谢。
假设您只有这两个特征(var1、var2),您可能希望: * 为每个位置下的每个变量创建 one-hot 编码特征。* 添加一个变量是第一个的列(例如两列 - 可能与树一起使用但不能与其他任何东西一起使用)。* 取每个可能的变量组合并将其用作您唯一的输入(例如,您然后取该out组合的平均值,可能添加一些先验或平滑)。
正如评论所提到的,如果out是一些离散事件,也许你想看看马尔可夫模型。