我想做什么
我想创建一个模型来从名称推断国籍,并创建以下数据框,结合来自 Kaggle 的两个数据集。
泰坦尼克号:灾难中的机器学习(input/titanic/train.csv)
PassengerId Nationality Name
0 1 CelticEnglish Braund
1 2 CelticEnglish Cumings
2 3 Nordic Heikkinen
3 4 CelticEnglish Futrelle
....
问题
如何使用以下两个数据找到构建第一个模型的算法:国籍和姓名?
由于都是自然语言,所以我可以理解使它们成为向量是必不可少的,这个问题将是多值分类。
但是,我不知道如何找到算法来训练这个数据集。