本质上,我们可以基于许多机器创建一个集群(例如,Beouwulf 风格)。这里的问题是,是否所有集群节点都需要完全相同的 cpu(s) 规范(例如,核心、缓存等)?如果不是这些公司如何扩展他们的集群单元,他们只是同时增加了数百或数千个单元?
集群每个节点内的 CPU 规格
计算科学
高性能计算
2021-12-06 05:32:20
1个回答
没有什么要求集群的节点是统一的。大多数批处理调度软件(SLURM、LSF、SGE、PBS 等)允许最终用户指定用于运行其作业的节点的要求。因此,如果用户每个节点需要一定数量的 RAM 或一定数量的内核,那么调度程序可以选择节点来满足这些要求。
然而,最终,大多数集群构建器使它们相当统一。集群通常是一次性购买的,预先购买了少量节点配置。我们在 TACC 最大的系统往往有一个主要的计算节点种类构成了系统的主体,以及 2-3 个其他计算节点配置来支持特殊需求。例如,我们在Stampede上有 16 个 1TB 大内存节点和更多 32 个内核,除了 6400 个具有 32GB RAM 和每个节点 16 个内核的计算节点之外。系统上还有 128 个具有 NVIDIA GPU 的节点。
公司可以根据需要预先购买所有节点或逐步购买它们。软件可以帮助他们管理复杂性。然而,大多数人大批量购买。这样定价会更好。从供应商处获取大量节点的成本可能会更低,而且一次完成所有操作肯定会节省安装时间。这些系统通常运行 3-5 年然后退役。在此期间可以购买和安装其他系统。
其它你可能感兴趣的问题