我正在学习机器学习。经过一些研究,我了解到分类问题的典型工作流程(在准备好数据之后)如下:
- 在测试、训练和验证集中拆分数据
- 训练模型
- 生成混淆矩阵
- 分析指标:accuracy、precision、recall 和 f1
- 根据我决定优化的指标调整超参数。
我的问题是:为什么我们需要混淆矩阵?考虑到我们要解决的问题类型,我们不应该已经知道需要优化什么指标吗?
我问这个是因为,据我了解,如果我们有足够的计算能力,我们基本上可以通过应用网格搜索(基本上包括每个调整参数的交叉验证)将步骤 2 和 5 分组,该网格搜索为输入要测量的指标。这意味着您需要事先了解指标,而且您无法获得混淆矩阵。
提前感谢您的回复。
