我为一个数据集(约 500 行)编写了一个 MLP,其中包含生物体的长度(L)和宽度(W)以及生物量的输出(生物体的重量,以磅为单位,B)。
mlp = MLPRegressor((5, 5), max_iter=1000)
我已经用特征训练了模型
# Model 1
# Input = Feature 1: Length, Feature 2: Width. Output = Biomass
df = {'length': [60.1, 59.2, 59.4, 58.5], 'width': [15.4, 16.2, 14.9, 15.7], 'weight': [8.34, 7,65, 7.89, 7.14]}
# Model 2
# Input = Feature 1: Length * Width^2. Output = Biomass
df = {'length*height^2': [60.1, 59.2, 59.4, 58.5], 'weight': [14253.31, 15536.44, 13187.39, 14419.66]}
我的模型具有一个特征的整体准确率超过 95%,但分离特征的准确率约为 85%。
我对 MLP 的理解是,模型 1 应该比模型 2 做得更好,因为它基本上会找到长度和高度与生物量的最佳组合,但是我的 1 特征模型做得更好。我也尝试过使用缩放器标准化数据集,但没有成功。
scaler = StandardScaler()