我喜欢 Weka 的可视化数据探索功能(它非常适合快速为您提供所有变量分布的一英里高的鸟瞰图)。
我有一个 0.5gb 的数据集,Weka 无法加载它(在具有 16gb RAM 的 64 位 Windows PC 上)。
对于那里的 Weka 粉丝,对于非常大的数据集,最接近的“视觉数据探索”替代方案是什么?
(FWIW - 当 Weka 无法加载非常大的数据集时,我已经完成了所有推荐的各种事情,例如,增加 Java 堆大小等)
更新:我尝试了 RapidMiner Basic(它是开源且免费的),并且成功了。
