我有一个回归问题,我的数据有 21 个特征,我希望使用 PCA 应用降维。据我所知,到目前为止我看到的所有教程都使用 PCA 来解决分类问题。我确实为回归做了 PCA,但我无法显示漂亮的散点图,这些散点图在 x 轴上显示 PC1,在 y 轴上显示 PC2,而目标在中间。
我写了以下代码
X = self.X
pca = PCA(n_components=NUM_FEATURES_PCA)
principal_components = pca.fit_transform(X)
principalDf = pd.DataFrame(data=principal_components,
columns=['PC1', 'PC2'])
finalDf = pd.concat([principalDf, self.df[[self.target_variable]]], axis=1)
plt.scatter(finalDf.loc[self.df[self.target_variable], 'PC1']
, finalDf.loc[self.df[self.target_variable], 'PC2'], s=50)
plt.xlabel('PC1', fontsize=15)
plt.ylabel('PC2', fontsize=15)
plt.title('2 component PCA', fontsize=20)
plt.show()
所以换句话说,我们可以在回归中为 PCA 显示这样的图吗?或者我们应该通过分箱或类似方式将连续目标变量转换为分类(标记为一个)?
参考:这些地块