作为分类器输入的数字列表

数据挖掘 机器学习 神经网络 分类 数据集
2022-02-13 00:08:23

我正在尝试使用我的数据来预测输入的类别。我的数据如下:

x1 = [0.2, 0.25, 0.15, 0.22] y = 1
x2 = [0.124, 0.224, 0.215, 0.095] y = 3
...
xn = [...] y = 2

问题是我的数据只是没有顺序的数字列表。我的意思是 x1 可以是x1 = [0.2, 0.25, 0.15, 0.22] y = 1x1 = [0.25, 0.22, 0.2, 0.15] y = 1列表中的数字以任何其他顺序排列。

有什么我可以做的,所以我可以建立一个分类器吗?谢谢!

1个回答

一个简单的选择是设计你的特征,使它们代表值的分布:每个特征代表一个 bin,它对特定实例的值是该实例对应范围的频率。fi

示例:让我们考虑 0 和 1 之间的 10 个 bin,即f1=[0,0.1),f2=[0.1,0.2),...,f10=[0.9,1]

  • x1=[0.2,0.25,0.15,0.22]表示为[0,1,3,0,0,0,0,0,0,0]
  • x2=[0.124,0.224,0.215,0.095]表示为[1,1,2,0,0,0,0,0,0,0]
  • ...