MLPerf Storage基准验证忆联UH812a高负载稳态表现，为万亿参数训练补上存储短板

全球人工智能技术快速发展的背景下，传统存储系统性能评估方式已难以适应新型算力需求；随着大模型参数规模突破万亿级别，存储系统能否持续稳定地为GPU集群提供数据支持，成为影响训练效率和成本的关键因素。为此，国际权威组织MLCommons推出了MLPerf Storage基准测试套件。该测试不同于传统存储性能评估方法，其核心价值在于直接测量存储系统能否使GPU集群保持高利用率运行。最新v2.0版本还增加了Checkpoint工作负载测试项，更精准模拟大模型训练中的容灾恢复场景。在此次严格测试中，UH812a固态硬盘表现出色。在U-Net 3D医疗影像训练场景中，该产品实现了14566.46 MB/s的最高吞吐量，接近理论最大值14900 MB/s。特别有一点是，即使在5颗H100 GPU并发工作的高负载下，其GPU利用率仍保持在96%以上，远超90%的基准要求。专家分析指出，UH812a的优势主要体现在三个上：一是强大的顺序读写能力，确保了大体积数据的稳定传输；二是优异的并发处理性能，可支持更多加速器同时工作；三是稳定的低延迟表现，有效避免了GPU因等待数据而闲置的情况。此技术突破对我国人工智能产业发展很重要。当前，全球正加速推进AI基础设施建设，高性能存储设备是支撑大规模训练的关键环节。UH812a的成功验证表明，我国在该领域已具备与国际领先水平竞争的实力。业内预计，随着人工智能应用的不断深入，对高性能存储的需求将持续增长。此次测试结果不仅为国内企业提供了技术参考，也为全球AI基础设施建设贡献了中国方案。

AI技术的发展需要算力、算法、数据三者协同,而高性能存储正是连接数据与算力的关键。随着国产存储技术在性能和稳定性上不断突破,我国AI基础设施的自主化水平将更提升。面向未来,持续的底层技术创新才是在全球AI竞争中保持优势的根本。