我的数据集中有一列包含数字和字符串作为值。我想对字符串变量进行编码,以便将其用于预测。做这个的最好方式是什么?
如何对包含字符串和数字的列进行编码
数据挖掘
机器学习
编码
2022-02-28 14:10:57
1个回答
编码是一种将类别转换为数值变量的方法,有很多技术。
最好的技术取决于您要编码的信息是什么以及您要使用的模型是什么。有些模型比其他模型更能受益于一种技术。
您应该问自己以下问题以尝试找到最佳解决方案: - 为什么列中有数值和分类值?- 拥有它们有意义吗?- 我使用的是哪种型号?- 将它们喂给这个模型的最佳方法是什么?
根据我得到的信息,我建议您要么对所有内容进行目标编码,要么将该功能一分为二。然后你在分类甚至数字中进行目标编码。只需检查哪个效果更好。
其它你可能感兴趣的问题