谷歌 Google Cloud 推出 A5X 裸金属实例,多站点集群可支持 96 万个 Rubin GPU

纵横百科 网络资讯 1

4 月 28 日消息,谷歌云服务部门 Google Cloud 在上周的 Google Cloud Next 大会上宣布推出由 NVIDIA(英伟达)Vera Rubin 机架级系统驱动的 A5X 裸金属实例。

注:裸金属可理解为云上的物理服务器,资源独立,不存在虚拟化开销和性能损失。

A5X 将采用英伟达的 ConnectX-9 SuperNIC 以及谷歌最新的 Virgo Network 超大规模扩展型 AI 数据中心架构,单站点集群中可扩展至多达 8 万个 Rubin GPU,而多站点集群中则可支持多达 96 万个 GPU,助力客户运行超大规模的 AI 工作负载。

Google Cloud AI 和计算基础设施副总裁兼总经理 Mark Lohmeyer 表示:

在 Google Cloud,我们相信未来十年的 AI 将取决于客户在真正集成、AI 优化的基础设施堆栈上运行其要求高度严苛的工作负载能力。

通过将 Google Cloud 可扩展的基础设施和托管 AI 服务与 NVIDIA 先进的平台、系统和软件相结合,我们为客户提供了极大的灵活性,使其能够训练、调优和部署从前沿模型、开放模型到智能体和物理 AI 工作负载在内的各种场景,同时优化性能、成本和可持续性。