如何开始得出预测的数学分数的过程?

数据挖掘 机器学习 数据挖掘 统计数据 预测建模
2022-02-14 19:59:31

我正在解决黑客级别的问题(非竞争)https://www.hackerrank.com/challenges/predict-missing-grade

基本上,您会获得一堆学生的其他科目成绩的测试数据,但数学除外,您将根据他们所有其他考试成绩来预测他们的数学成绩。假设您收到了以下数据

{"SerialNumber":1,"English":1,"Physics":2,"Chemistry":3,"ComputerScience":2}

您将如何生成该学生的数学分数或提出预测引擎来生成数学分数?我知道这就是这个问题的全部意义,但有人可以给我一个提示或资源,以便我有机会弄清楚这一点并真正开始吗?我真的很想学习。

2个回答

您正在寻找的是机器学习算法。尽管最简单的方法是取平均分并使用它,但还有更准确的方法来制作预测模型。

这是我做的第一个数据科学教程。它非常适合入门。这是RPython中的内容。

如果您正在寻找一个简短的答案,您可以查看如何实施,我会查看随机森林。

我实际上会尝试回归。另外,不要在机器学习算法中错误地使用序列号!我建议回归而不是“更好的”机器学习算法的原因是因为你说你想学习,理解你的算法(从长远来看,真正擅长这些东西)很重要'正在使用。回归是本书中最简单的工具,效果很好!Weka 非常易于使用,因此您可以即插即用不同的机器学习算法。另一个让我赢得几场比赛的指针是在使用回归/机器学习之前做一些特征选择。例如,在您的情况下,可以合理地假设,与英语成绩高的学生(但不一定是物理)相比,物理成绩高的学生可能更有机会在数学上取得高分。如果您有足够的数据,算法本身将能够推断出这些正/负相关并相应地训练模型。有时,没有足够的数据,你必须做一些特征选择。祝你好运!我自己是 Kaggle 的常客,我认为你走“黑客”路线来了解更多信息真是太好了。这是解决实际数据和工程问题的最佳方式。算法本身将能够推断出这些正/负相关性并相应地训练模型。有时,没有足够的数据,你必须做一些特征选择。祝你好运!我自己是 Kaggle 的常客,我认为你走“黑客”路线来了解更多信息真是太好了。这是解决实际数据和工程问题的最佳方式。算法本身将能够推断出这些正/负相关性并相应地训练模型。有时,没有足够的数据,你必须做一些特征选择。祝你好运!我自己是 Kaggle 的常客,我认为你走“黑客”路线来了解更多信息真是太好了。这是解决实际数据和工程问题的最佳方式。