Weka 替代方案 - 使用非常大的数据集进行可视化数据探索

数据挖掘 可视化 威卡
2022-03-14 18:55:43

我喜欢 Weka 的可视化数据探索功能(它非常适合快速为您提供所有变量分布的一英里高的鸟瞰图)。

我有一个 0.5gb 的数据集,Weka 无法加载它(在具有 16gb RAM 的 64 位 Windows PC 上)。

对于那里的 Weka 粉丝,对于非常大的数据集,最接近的“视觉数据探索”替代方案是什么?

(FWIW - 当 Weka 无法加载非常大的数据集时,我已经完成了所有推荐的各种事情,例如,增加 Java 堆大小等)


更新:我尝试了 RapidMiner Basic(它是开源且免费的),并且成功了。

2个回答

我尝试了 Azure 机器学习(由 Microsoft 提供),它非常好。它可以轻松处理大型数据集,并具有类似于用于 ML 任务和可视化的 weka 管道。他们免费提供 30 天,所以你可以试试。您可以谷歌它或点击此链接Azure ML

首先,我想提出Orange Data Mining Suite

在此处输入图像描述

但是,我几乎可以肯定地知道,没有可用的 64 位 NumPy 的 Windows 版本,Orange 使用它,因此您的数据可能不适合他们提供的 32 位 Windows 版本。如果你能很好地使用 Python,它可能是可安装的,但它也可能被证明更容易切换到一些更高效的平台(即支持 GNU/Linux 和 Macintosh OS X)。