假设一个分类任务A,有很多方法. 任务是通过一致的度量来衡量的。例如,任务 A 可以是二元分类。在这种情况下,可以使用 F-score、ROC 曲线。
我对一些研究进行了调查,发现
- 用数据集评估(打开)使用预处理只有(似乎是开创性的工作)。
- 用数据集评估(打开),(私人)并与, 声称有更准确的结果,但使用不同的数据预处理.
- 提出了使用数据集的新方法(私人)并且没有提供任何比较和
我正在尝试在这方面工作,但有很多不一致之处。没有一种方法通过验证数据进行验证。他们只是使用了训练和测试数据。我认为一些参数是为测试数据集调整的,尽管作者没有这么说。由于该领域不是面向数据科学的,并且数据集的数量很少,因此可能会发生这种情况。
我们可以将哪种方法视为最先进的方法?
我们如何得出每种方法的普遍性?