计划构建 HPC

计算科学 高性能计算
2021-12-09 19:33:34

我开始研究安装 HPC 的最佳方式。

在我的数据中心上,我必须使用此设置初始测试 3 台服务器。

  • 戴尔 PowerEdge R720
  • 2 个英特尔至强 E5-2680v2 2.8GHz
  • 10 个 16GB RDIMM
  • XenServer 6.5

我对 CentOS 更放心。那么第一个问题是什么是最稳定的用于 HPC 的 CentOS?

此 HPC 的平面使用此工具:

  • 开放堆栈
  • 扭矩(资源管理器)
  • Maui(集群调度程序)
  • 金牌(分配经理)
  • 环境模块

因此,如果您对这个项目感兴趣,请帮助找到路

2个回答

Maui 和 Gold 几乎已经死了(检查最后的发布日期)——如果你需要一些免费的高级调度和分配管理的东西,我会看 SLURM http://slurm.schedmd.com/(尽管他们都有自己的痛苦点)。如果你只有三个节点,你需要这些吗?然后 Torque 也可以用于简单的调度。

如果您正在为更大的系统构建原型,那么请使用 SLURM 并专注于节点配置工具,以便您知道如何扩展和控制事情(要查找的一些关键字是 Ansible/Puppet/Chef/xCat - OpenStack 还没有,但这取决于您的工作负载类型以及您以后是否想扩展到云)

Centos 6 相当稳定(等待 Centos 7.1 并计划升级路径)。

环境模块岩石。

稳定的?从稳定性的角度来看,最新的 CentOS 6 或 7 都应该没问题。我不会把 OpenStack 算作一个 HPC 工具,但是云堆栈从它们开始的地方就在性能方面出现了。