对象检测被定义为模型需要找出每个对象的边界框和类别的问题。许多用于对象检测的机器学习解决方案都围绕着“两次通过”——一种用于创建区域的边界框,另一种用于对其进行分类。
我想知道这个问题的一个子集是否有一个名称. 我觉得这里有一个有趣的机会,因为模型的整个分类部分(基本上)可以被忽略。显然,我可以只用一个类训练一个典型的对象检测模型,但只是想看看是否有更专业的方法。
对象检测被定义为模型需要找出每个对象的边界框和类别的问题。许多用于对象检测的机器学习解决方案都围绕着“两次通过”——一种用于创建区域的边界框,另一种用于对其进行分类。
我想知道这个问题的一个子集是否有一个名称. 我觉得这里有一个有趣的机会,因为模型的整个分类部分(基本上)可以被忽略。显然,我可以只用一个类训练一个典型的对象检测模型,但只是想看看是否有更专业的方法。
如果您在谈论像 Faster R-CNN 这样的“两阶段”对象检测器,请注意第二阶段不仅用于分类,还用于获得更准确的结果(https://stackoverflow.com/a/61965140/4762996) .
另外,我猜想训练一个有很多类的检测器就像一个正则化器,这会带来更好的准确性。
使用一个类进行显式训练的唯一好处可能是减小了模型大小(以及相应的加速)。
另请注意,有一个阶段对象检测器(CornerNet:https ://arxiv.org/abs/1808.01244,YOLOv3:https ://pjreddie.com/media/files/papers/YOLOv3.pdf,DETR :https:// arxiv.org/abs/2005.12872等等)。我只是想强调一下,仅仅因为你只有一个类,采取两阶段检测架构并跳过第二阶段是没有意义的。
最后,看看:https ://stats.stackexchange.com/q/351079
一个有趣的方向是合并一类分类方法,例如这里提到的:https ://stackoverflow.com/a/61965358/4762996 。