搜索历史 清空

华为OceanStor A系列存储再登MLPerf全球性能之巅

[中国,深圳,2025年8月15日] 近日,全球权威AI性能评测组织公布MLPerf Storage v2.0基准测试最新结果,华为OceanStor A系列存储联合济南超级计算技术研究院(“JNIST”)斩获多项全球第一,再度登顶单存储设备、每U存储设备及单客户端性能榜首。

250815-01

MLPerf Storage作为全球AI存储性能评测权威标杆,以严格的标准化流程和跨厂商可比性著称。本次测试吸引26家主流厂商参与,其Training场景涵盖3D U-Net等负载,聚焦考核GPU利用率与横向扩展能力,验证存储系统对大规模AI集群算力的支撑效能;同时新增Checkpointing场景,作为首个测试大模型训练检查点性能的行业标准,覆盖断点续训、模型存档等,为存储选型提供关键参考依据。

Training场景:华为以698 GiB/s性能刷新全球记录

在存储带宽要求最高的3D U-Net训练测试中,华为OceanStor A系列存储在保持GPU利用率90%以上的条件下,斩获三项全球第一。

  • 单台8U双节点架构的OceanStor A800,可支撑255张H100 GPU训练需求,持续提供698 GiB/s稳定带宽。
250815-03

3D U-Net测试用例:单存储设备性能排名第一

  • 单台2U双节点架构的OceanStor A600,可支撑76张H100 GPU训练需求,每U带宽达108 GiB/s,单客户端达104 GiB/s。
250815-11

3D U-Net测试用例:每U性能和单客户端性能排名第一

Checkpointing场景:OceanStor A系列存储领先第二名6.7倍

在Checkpointing测试中,华为OceanStor A系列存储在模拟单台8卡服务器的8并发场景时,性能表现突出:

  • 在llama3_8b场景下,单客户端读写带宽分别达40.2 GiB/s、20.5 GiB/s,排名第一。
  • 在llama3_70b场景下,单客户端带宽达68.8 GiB/s、62.4 GiB/s写带宽,领先第二名6.7倍,排名第一。
250815-06

Checkpointing测试用例:单客户端性能排名第一

华为OceanStor A系列存储持续创新,加速大模型应用落地

面对未来更强劲的算力需求,华为OceanStor A系列存储通过多维度技术创新,实现性能随客户端与存储节点数量线性增长,可提供百TB级稳定集群带宽,高效支撑大规模训练数据访问,并针对大模型训推场景实现全流程加速。

该系列存储具备卓越的高扩展性,其集群支持EB级容量横向扩展,保障海量数据存储需求;在数据韧性方面,通过架构创新实现99.999%高可靠性;创新构建基于PB级KV Cache全局共享资源池的全新数据范式,在保证推理精度的前提下,首token时延(TTFT)最高降低90%、长序列场景推理吞吐可提升10倍+,显著优化推理体验;同时内置RAG知识库支持标量、向量、张量、图等多模式检索,大幅降低AI大模型使用门槛。

展望前路,华为OceanStor A系列存储将持续深耕,推出面向HPC、AI大模型训/推等场景领先的产品与解决方案,与客户共赢全面智能化的未来。

相关新闻