假设我有一个分类器,它检测代码脚本是用 Python 还是 C++ 还是 Java 编写的。
因此,我的分类器有 3 个输出,它们给出了某个代码脚本是上述 3 种编程语言之一的概率。
然而,不幸的是,测试数据可能包含一些用其他编程语言(如 Javascript、Ruby、PHP 等)编写的代码脚本。
如果我让我的分类器保持原样,那么它将这些代码脚本分类为 Python、C++ 或 Java,这肯定是非常错误和误导的。
添加另一个名为“Other”的类是否有意义,该类将包含各种其他编程语言(Javascript、Ruby、PHP 等)的代码脚本,甚至是不相关的文本来处理它?
有没有更好的主意?