我有一个患者记录数据集。但我不知道他是否患有癌症 +ve。所以,我的数据集中没有标签。
现在我可以运行机器学习模型,比如聚类来生成标签。
例如:我可以运行聚类以根据相似性对两个类进行分组,并找出谁都属于 +ve 和 -ve 类。
当然,我们不能坐下来手动查看患者的数据,以了解他是否真的患有癌症 +ve。
那么当我们通过机器学习模型(如上面的聚类)生成标签时,这是一种推荐的方法吗?
它是否用于人们没有基本事实并且仅依赖基于 ML 模型的标签的行业/实时?
我们如何才能信任这些生成的标签?
如果它是一个人,我知道它是可以信任的。但是我们如何相信这些标签。
工业中是否使用了类似的东西,它们如何解决信任问题?