假设我有 1000 个训练示例,其中每个训练示例都包含一个桶,例如'engineering',或者'management'和一个标签列表,例如['software', 'python', 'product'],人类为用例选择了最相关的标签,例如'software'.
所以我们的数据是这样的:
bucket tags best_tag
engineering [fullstack, software] software
engineering [java, python, software] software
management [technical, product] product
什么样的模型或方法适合获取标签列表并根据某种潜在的潜在层次结构预测最佳标签?