我有一个相当大的数据集(> 100k 行),其中包含物流运输的信息。(出口货物)
数据集如下所示:
|shipper|consignee |origin|destination |
|-------|-----------------------------|------|---------------------------------------------|
|6409292|288882 |USSFO |CNPVG |
|6409292|288882 |USSFO |CNPVG |
|6409292|182724 |USSFO |HKHKG |
|6409292|182724 |USSFO |HKHKG |
|8201922|948292 |USSFO |FRCDG |
|8201922|948292 |USSFO |FRCDG |
|8201922|948292 |USSFO |FRNIC |
|8201922|291222 |USEWR |AEDXB |
所以我们这里有一份过去发货的清单。它显示了托运人和收货人之间的关系,以及货物从哪里来和发往哪里。
根据过去的数据,我希望能够通过查看consignee code和来预测何时添加新货件origin。
例子
以下面的新预订为例:
|shipper|consignee |origin|destination |
|-------|-----------------------------|------|---------------------------------------------|
|1234567|948292 |USMOB |? |
如何训练模型来预测destination?ML 中的这个区域指的是什么?