我知道这个问题是特定于供应商的,随着时间的推移它可能会改变,但我想知道现在(2022 年)NVIDIA 可用的 GPU 卡如何以任何方式在许可方面或硬件方面受到限制,以用于训练和干扰?是否禁止在生产系统中使用这些卡?例如,商店中有几款 RTX 3060 游戏卡。是否允许将这些用于人工智能?附带问题:是否有任何已知的 CUDA 限制拒绝在特定的受限卡上工作?
NVIDIA GPU 限制如何影响 AI 计算框架?
数据挖掘
硬件
显卡
2022-03-05 20:34:28
1个回答
我惊讶地发现这是一个真正的许可证限制,仍然有效,并且在他们网站上的NVIDIA 的 Geforce 驱动程序软件的 EULA上注明。相关部分在第2.1.3 节限制:
没有数据中心部署。该软件未获得数据中心部署许可,但允许在数据中心进行区块链处理。
这意味着,如果您尝试在专用数据中心设置大规模服务,并使用多台配备消费级 NVIDIA Geforce 卡(包括 RTX 3060)的机器,NVIDIA不会许可您使用他们的驱动程序软件。
此限制不适用于培训和研究工作站。您可以将它们用于任何目的,包括 AI。因此,您可以启动一个研究团队,使用相对便宜的游戏卡进行一些神经网络项目。Lambda Labs等专门构建数据科学/AI 工作站的公司也使用消费级 GPU 卡。
GPU 资源的云提供商,例如 Google 的 GCP,确实遵守了这个限制,并且只支持更昂贵的 Tesla 卡,例如 V100 和 A100。
如果您的目标是构建自己的 AI 数据中心,以使用更便宜的消费级 GPU 运行商业系统,那么您就不走运了。但是,除此之外,您仍然可以使用相同的 GPU 来研究和开发相同的服务。大规模部署相同的模型需要更昂贵的硬件,但大多数 AI 框架(如 TensorFlow 或 PyTorch)很乐意在不同的 GPU 上运行相同的模型。因此,在您扩展到数据中心服务时,这似乎只是一个问题 - 以及额外的费用,不一定是阻碍因素。
其它你可能感兴趣的问题