Meta 将使用微软 Azure 最新虚拟机 (VM) 系列
Meta 于 2021 年首次使用微软 Azure 虚拟机。由于其更快的分布式 AI 训练,Meta 将 NVIDIA A100 80GB GPU 应用于其大规模 AI 研究,例如训练其 OPT-175B 语言模型。显然,它还可以做更多事情,因此 Meta 决定为其 AI 研究提供更多机器学习训练工作负载。
“作为这种更深层次关系的一部分,Meta 将扩大其对 Azure 超级计算能力的使用,以加速其 Meta AI 团队的人工智能研发,”Azure HPC 和 AI 高级项目经理 Sherry Wang 指出。“Meta 将使用 Azure 中最新的虚拟机 (VM) 系列(NDm A100 v4 系列,配备 NVIDIA A100 Tensor Core 80GB GPU),5400 个 GPU 的专用 Azure 集群用于他们的一些大规模 AI 研究工作负载。”
微软和 Meta 的合作并不止于此。两家公司还计划在 Azure 上扩展 PyTorch 的使用。Wang 表示,微软将创建 PyTorch 开发加速器,以便在 Azure 上快速实施基于 PyTorch 的解决方案。此外,该公司承诺将持续提供 PyTorch 企业级支持,“以使客户和合作伙伴能够在云和边缘的生产环境中部署 PyTorch 模型。”
Meta 人工智能副总裁 Jerome Pesenti 表示:“我们很高兴能够加深与 Azure 的合作,以推动 Meta 的人工智能研究、创新和开源工作,从而使全球更多的开发人员受益。” “凭借 Azure 的计算能力和每台 VM 1.6TB / s 的互连带宽,我们能够加速不断增长的培训需求,以更好地适应更大、更具创新性的 AI 模型。此外,我们很高兴与微软合作,将我们的经验扩展到使用 PyTorch 从研究到生产的客户。”