机器学习数据集:对于完全连接来说足够简单,但对于逻辑回归来说不够简单

数据挖掘 机器学习 数据集 逻辑回归
2022-03-07 22:37:00

我想知道是否有人可以将我引导到具有以下条件的分类任务的数据集:

  • 单独的多项逻辑回归并不能学习一个好的分类器
  • 一系列全连接层能够学习一个好的分类器
  • 任务不是 MNIST

谢谢

1个回答

这是一个逻辑回归应该不可能的一维问题:

  • 在 [0, 10] 上均匀生成 x
  • 让 y = sin(2 * pi * x)

如果您想要分类问题,请将 y_disc 定义为:

  • 0 如果 y > 1/sqrt(2)
  • 1 如果 1/sqrt(2) > y > -1/sqrt(2)
  • 2 如果 y < -1/sqrt(2)。

这是非线性的,所以逻辑回归应该做得很差。此外,如果您决定将 x 的更高幂放入逻辑回归分类器中,我认为您将需要很多幂才能准确表示接近 10 的泰勒级数。

如果事实上,您可以尝试在离散化之前向 y 添加一个小的噪声项 - 我怀疑这会导致您的逻辑回归量在它能够准确地近似 x = 10 附近的行为之前很久。