哪些监督机器学习算法假设特征变量呈正态分布?
数据挖掘
线性回归
特征工程
监督学习
2022-03-10 10:12:35
1个回答
如果您要区分统计和机器学习,那么您需要定义两者之间的边界,并且该边界将基于意见。哪些算法属于机器学习,哪些属于统计学,这是一个定义问题。
我将尝试举一些例子,而不是承诺其中一个。
- 线性回归期望误差(残差)呈正态分布。这来自最大似然和正态分布的 PDF 中的术语。
- 逻辑回归期望类成员的对数几率是线性的。这是针对具有相等方差的两个正态分布的类给出的。它遵循贝叶斯概率。
- 线性判别分析需要两个具有相同协方差矩阵的正态多元分布类。
即使您的数据违反假设,您也可以应用这些算法,但结果(在统计数据中:参数估计)将不会(完全)正确。它们偏离实际值的程度取决于假设违反的程度。
其它你可能感兴趣的问题