协作特征工程的最佳实践是什么?

数据挖掘 机器学习 特征提取 特征工程 特征缩放 特征构造
2022-02-28 03:00:19

我在一家大公司从事多个数据科学项目。对于每个项目,我和我的同事构建的特征对该项目中的特定目标具有一定的预测价值。

一些项目的相似之处在于它们为相同类型的实体(例如客户或商品)预测某些东西。

在关于同一实体的项目之间共享功能对我来说是有意义的。或者至少,可以轻松地重用另一个项目的功能。例如,在某些项目中,有人可以构建特征“customer since”,这将指示某人成为客户的年数。在其他一些项目中,一些人构建了一个特征“估计年龄”,这是一些机器学习管道的结果。在第三个项目中,我可能想同时使用这两个功能。

共享这些功能的最佳做法是什么?我应该分享代码还是物化结果?是否有帮助此过程的软件包?贵公司如何解决这个问题?

0个回答
没有发现任何回复~