在我的研讨会工作中,我使用了以下句子:
过度拟合是机器学习和统计中最重要的方面。
在这里,我想用Inductive Reasoning或Statistical Inference替换“statistics” 。术语有点混乱,我不确定该用哪个。
有人可以澄清两者之间的区别(如果可能的话,从机器学习的角度来看),以便我知道该选择哪一个。
在我的研讨会工作中,我使用了以下句子:
过度拟合是机器学习和统计中最重要的方面。
在这里,我想用Inductive Reasoning或Statistical Inference替换“statistics” 。术语有点混乱,我不确定该用哪个。
有人可以澄清两者之间的区别(如果可能的话,从机器学习的角度来看),以便我知道该选择哪一个。
归纳推理广义上是指从已知事物中推断未知事物的一般过程,并且通常涉及一些尝试,以基于已知事物来衡量对不确定命题的证据支持。它与演绎推理的区别在于,不确定命题的真假不是由已知事物在逻辑上决定的。统计推断是归纳推理的一种形式化形式,其中观察被量化为数据,概率和统计理论的规则应用于该数据以进行推断。
统计理论(部分)是一种规范理论,告诉你应该如何进行归纳推理。该理论的正式应用需要量化数据和一些技术知识,但该理论还为您提供了广泛的原则,可以以定性方式应用于不太正式的环境。在实践中,归纳推理无处不在,而统计理论既费时又困难,因此人类(甚至是统计学家)仅在遇到的一小部分归纳问题中应用统计理论的形式工具。
由于您在正式统计理论的背景下进行演讲,因此在这种背景下提及过度拟合可能更有意义(即,说“统计推断”而不是“归纳推理”)。过度拟合是指使用无法充分考虑随机性的分析,因此与数据的拟合过于紧密。如果您要在统计推断的上下文中提及过度拟合,您可能希望以适当的形式将其置于该理论的上下文中来描述这一点(例如,描述因过多参数而发生的过度拟合在模型中,未能使用训练测试拆分等)。
在正式的统计推断之外,还可以在归纳推理的更广泛背景下讨论过度拟合。在这个更广泛的背景下,过度拟合同样是指一种过度活跃的模式识别,它不能充分考虑随机性,因此与观察的关系过于密切。这种普遍的认知倾向被称为apophenia并已被广泛研究。有许多心理学研究测试人类识别随机数序列的能力。这些表明人类倾向于对模式发现有过度活跃的感觉,并且即使在完全随机的情况下也倾向于感知模式(例如,他们倾向于低估随机生成的数据中可能的运行次数、样本相关性等)。这个讨论超出了机器学习的正式讨论范围,但它是一个有趣的小信息,与该上下文中的过度拟合有关。
所以,至于你应该用什么词,我认为这取决于你想讨论这个现象的概括程度。
(旁注:我同意Jacom Socolar的评论,即“过度拟合”不是机器学习和统计中最重要的方面。这非常重要,但我想说的是,首先能够拟合模型还很遥远更重要。)
很多定义比比皆是,这里有两个我发现基本上代表我读过的其他人
'归纳推理与演绎推理相反。归纳推理根据具体观察进行广泛的概括。(https://www.livescience.com/21569-deduction-vs-induction.html)
“统计推断意味着根据数据得出结论”(http://www2.stat.duke.edu/~fab2/inference_talk.pdf)
我的理解是统计推理是一种特殊类型的归纳推理,它专门使用统计工具以严格的方式支持和指导推理/推理。
这是查看两个样本的数据和说,
您特别提到过拟合,我认为这是机器学习面临的最大挑战之一。但是,正如您在陈述中指出的那样,它绝不是机器学习所独有的,而是整个科学领域的一个基本问题,并且是统计推断危险的核心。根据定义,统计推断是将某种构造或模型应用于您的特定数据的结果,然后推测它将继续应用于可比较甚至推理它在扩展(外推)情况下的表现。
所以在机器学习中,归纳推理可以很简单:
'当我们校准模型 A 并在验证集中保持强大的性能时,它表现出良好的性能。因此,我们希望当我们在最终用例中部署模型时,它将继续提供类似水平的性能。这是基于最终用例中的主题符合与验证集中的主题相似的配置文件的假设。特定的排除是 A、BC 和 D。
一个相当彻底的统计推断将是:
'模型 A 与 X (X-X) % 校准准确度和 Y (Y-Y)% 在验证集中,因此我们期望达到 Z (Z-Z) % 当模型部署到其最终用例时'。这是基于这样的假设,即最终用例中的主题符合与验证集中的主题相似的配置文件,其中一组特征 M(M-M), N(N-N), O(O-O)。具体排除项是 A、BC 和 D。如果最终用例将模型暴露给具有 M 的主题米那么精度可能会受到 V%(等)的影响'