Kaggle Titanic 数据集上的生存表分类方法是实现朴素贝叶斯的一个例子吗?我之所以问,是因为我正在阅读朴素贝叶斯,基本思想如下:“找出属于每个类的先前看不见的实例的概率,然后简单地选择最可能的类”
生存表(http://www.markhneedham.com/blog/tag/kaggle/)似乎是对给定所选特征值的可能组合的生存可能性的评估,我想知道它是否可以作为一个例子朴素贝叶斯的另一个名字。有人可以阐明这一点吗?
Kaggle Titanic 数据集上的生存表分类方法是实现朴素贝叶斯的一个例子吗?我之所以问,是因为我正在阅读朴素贝叶斯,基本思想如下:“找出属于每个类的先前看不见的实例的概率,然后简单地选择最可能的类”
生存表(http://www.markhneedham.com/blog/tag/kaggle/)似乎是对给定所选特征值的可能组合的生存可能性的评估,我想知道它是否可以作为一个例子朴素贝叶斯的另一个名字。有人可以阐明这一点吗?
朴素贝叶斯只是解决泰坦尼克号问题的几种方法之一。Kaggle 的泰坦尼克号问题的目的是建立一个分类系统,该系统能够在给定一些输入数据的情况下预测一种结果(一个人是否幸存)。生存表是一个训练数据集,即包含一组用于训练系统的示例的表。
正如我之前提到的,你可以应用朴素贝叶斯来构建你的分类系统来解决泰坦尼克号问题。朴素贝叶斯是目前最简单的分类算法之一。它假定数据集中的数据具有非常特定的结构。有时朴素贝叶斯可以为您提供足够好的结果。即使不是这样,朴素贝叶斯作为第一步也可能有用;您通过分析朴素贝叶斯的结果以及通过进一步的数据分析获得的信息将帮助您选择接下来可以尝试的分类算法。分类方法的其他示例是 k-最近邻、神经网络和逻辑回归,但这只是一个简短的列表。
如果你是机器学习的新手,我建议你看看斯坦福的这门课程:https ://www.coursera.org/course/ml