HPE 表示,其对 AMD“Helios”机架级平台的实施将包括其所谓的“首款通过标准以太网为 AI 工作负载提供优化性能的纵向扩展交换机”,这得益于其与博通的合作开发。

HPE 周二表示,它将成为“首批采用 AMD GPU 加速 AI 服务器机架的 OEM 厂商之一”,该机架将于明年与英伟达备受期待的 Vera Rubin 平台展开竞争。
总部位于德克萨斯州休斯顿的服务器巨头 HPE 在西班牙巴塞罗那举行的 HPE Discover 2025 大会上宣布,计划明年向云服务提供商(包括所谓的“新云”)提供 AMD 的“Helios”机架级平台,该平台由 72 个 AMD Instinct MI455X GPU 提供支持,用于大规模 AI 训练和推理工作负载。
【相关报道:英伟达CEO解释为何他认为人工智能泡沫“截然不同”】
在 AMD 首席执行官 Lisa Su 表示这家芯片设计公司看到了在英伟达主导的数据中心 AI 市场中获得两位数份额的“非常清晰的路径” ,并预计到 2027 年其Instinct GPU 及相关产品将带来数百亿美元的年收入后不到一个月,HPE 就公布了其双宽 Helios 机架计划。
相比之下,英伟达在不到两周前表示,其 Blackwell 和下一代 Rubin 平台(包括Vera Rubin 平台)从今年年初到明年年底的收入“预计”将达到 5000 亿美元。
据HPE称,单个Helios机架预计将提供260 TBps的扩展带宽、高达2.9 exaflops的FP4性能、31 TB的HBM4内存以及1.4 PBps的内存带宽,以支持参数量高达万亿的大规模AI模型。这些数据与AMD在6月份公布的Helios初始规格相符。
HPE表示,其基于开放计算项目规范的Helios方案将包含所谓的“首款可通过标准以太网为AI工作负载提供优化性能的纵向扩展交换机”。这将实现每个机架72个GPU之间的高速连接。
该公司表示,其子公司瞻博网络(Juniper Networking)正与半导体巨头博通(Broadcom)合作,专门为其Helios产品开发一款可扩展的网络交换机。该交换机采用博通的Tomahawk 6网络芯片,基于以太网Ultra Accelerator Link标准。众多科技巨头和其他公司都支持该标准,将其作为英伟达NVLink互连技术的替代方案。
HPE表示,这款交换机将利用其“原生AI自动化和保障功能,简化网络运维,从而加快部署速度并降低总体成本”。该公司还补充说,这款交换机“最大限度地减少了供应商锁定,并能更快地进行功能更新”。
据 HPE 称,Helios 机架还将采用 AMD 的 ROCm 软件和 Pensando 网络技术来“加快创新速度并帮助降低总体拥有成本”。
虽然 AMD 投入了大量资金来正面挑战英伟达,但该公司今年早些时候告诉 CRN ,它还没有准备好让 Instinct GPU 成为广泛的渠道产品,而是选择暂时与特定的渠道合作伙伴合作。
据 AMD 高管 Kevin Lensing 称,这是因为该公司专注于与最大的客户(包括 Meta、 OpenAI 、微软和 xAI)进行“高触达”互动,以确保他们获得最佳体验。
“在 Instinct 上进行渠道赋能的挑战在于,如果我们无法触及所有渠道并提供良好的体验,我们就无法实现一对多的模式,”负责美洲和超大规模销售的 Lensing 在 6 月份的一次采访中说道。
这些精选合作伙伴中包括总部位于伊利诺伊州诺斯布鲁克的系统集成商 International Computing Concepts,该公司今年在 CRN 的快速增长 150 强榜单中排名第一,其过去两年的三位数增长主要得益于其与英伟达的业务合作。
国际计算概念公司首席技术官 Alexey Stolyar 周一告诉 CRN,他看到基于 Instinct 的服务器解决方案在 neocloud 客户群体中“获得了一些发展势头”,他指的是专注于 AI 计算的新兴小型云服务提供商群体。
“AMD 确实在积极寻求一些非常具体的机会,他们可以全程指导,确保提供最佳性能等等。我认为一旦他们对这方面有了些许了解,并且变得更加稳固,他们就会开始向合作伙伴群体推广,”他说。
Stolyar 表示,虽然他很喜欢 AMD 的 Helios 机架支持像 Ultra Accelerator Link over Ethernet 这样的开放标准的想法,但他警告说,科技行业在充分利用这一标准时可能会遇到障碍。
这位解决方案提供商的高管以公司在帮助客户利用英伟达机架级平台(如 GB200)的扩展能力方面面临的挑战为依据,发表了这一断言,并表示“并没有很多工作负载能够真正将其性能发挥到极致”。
他补充说,这条规则的例外是超大规模数据中心运营商,他们拥有足够的专业知识,可以最大限度地利用横向扩展带宽来运行大规模人工智能训练作业。
“真正懂得如何操作的人并不多。但话虽如此,我们也看不到它有什么实际用途,”斯托利亚尔说道。
该高管预计大多数公司将利用机架级平台的横向扩展能力,虽然这种平台可能无法提供相同的带宽,但可以让数百个 GPU 在同一架构上相互连接。
“没错,速度是慢了一点,但只要你没有用完所有带宽,就没问题。即使你用完了所有带宽,现在你也能访问更大的GPU资源池了,”斯托利亚尔说。
四川旭辉星创有限公司_四川省政采一体化框架协议入围、央采、成都市政采企业,信创产品方案解决商
欢迎访问网站:成都联想服务器总代理商 https://www.lxzdl.com/
欢迎访问网站:浪潮服务器代理商 https://www.lczdl.com/
欢迎访问网站:四川惠普服务器授权代理商 https://www.cditdl.cn/
欢迎访问网站:四川戴尔服务器金牌代理商 https://cditdl.com/
服务热线:13438344046 李丹(微信同号)
友情链接: 成都惠普服务器 成都HP工作站经销商四川慧与存储器成都HPE服务器成都H3C服务器四川HP图形工作站 成都戴尔服务器工作站 成都联想服务器工作站 成都浪潮服务器 成都超聚变服务器 成都华三(H3C)服务器 四川戴尔台式机笔记本销售中心 四川联想服务器经销商 成都dell台式机笔记本直销中心
Copyright 2021-2022 cditdl.cn 版权所有蜀ICP备2024051727号-5
请用微信扫描二维码