我有一个如下所示的数据(使用传统分类和基于 DL 的方法处理分类问题)
我在此处和此处的特征工程教程(和工具)中看到,它们通常根据数字列计算基本统计特征,例如、max(loan amount)、min(loan amount)、sum(loan amount)等。stddev(loan amount)average (loan amount)
我知道所有这些都是为了提高模型的预测能力。
但是,我的问题是
什么时候max(loan amount)或是std dev(loan amount)一个重要特征是什么意思?可以帮助我理解它传达了什么见解?如何解释这个特性?能用简单的英文解释吗?
假设我们运行一个随机森林模型,并且在特征重要性中我们看到这max(loan amount)是最重要的特征。这是什么意思?我正在寻找意义来理解它所传达的洞察力。这个问题与模型无关。它只是关于术语/功能的含义std dev (loan amount)或max(loan amount)或min(loan amount)
