我有一个数据集,其中包含来自 20 个不同类别的对象的信息。这些对象在 100 个图像上手动标记。对象位于正方形图像上的 3 行中,同一类对象可以有多个实例。对于给定的对象,我有以下数据:
- 它的类
- 边界框中心坐标
- 边界框大小
- 对象是否在正确位置的信息
最终目标是有一个分类器,它可以确定检测到的物体的位置是否正确。我不确定是否应该将标签或“正确性”视为输出,您有什么建议?此外,在这些数据的情况下,分类器的最佳候选者是什么,考虑到以下情况:
- 每个训练图像(带有标记的对象)都被小角度、透视、平移等扭曲。
- 图像上有一种正确的对象排列
请查看以下数据的简化说明:数字 - 标签,粗体 - 位置不正确
====================
1 1 1 3 3 5
6 7 1 1 4 4
9 5 5 5 9 7 7 7
====================