全球人工智能技术快速发展的背景下,传统存储系统性能评估方式已难以适应新型算力需求;随着大模型参数规模突破万亿级别,存储系统能否持续稳定地为GPU集群提供数据支持,成为影响训练效率和成本的关键因素。 为此,国际权威组织MLCommons推出了MLPerf Storage基准测试套件。该测试不同于传统存储性能评估方法,其核心价值在于直接测量存储系统能否使GPU集群保持高利用率运行。最新v2.0版本还增加了Checkpoint工作负载测试项,更精准模拟大模型训练中的容灾恢复场景。 在此次严格测试中,UH812a固态硬盘表现出色。在U-Net 3D医疗影像训练场景中,该产品实现了14566.46 MB/s的最高吞吐量,接近理论最大值14900 MB/s。特别有一点是,即使在5颗H100 GPU并发工作的高负载下,其GPU利用率仍保持在96%以上,远超90%的基准要求。 专家分析指出,UH812a的优势主要体现在三个上:一是强大的顺序读写能力,确保了大体积数据的稳定传输;二是优异的并发处理性能,可支持更多加速器同时工作;三是稳定的低延迟表现,有效避免了GPU因等待数据而闲置的情况。 此技术突破对我国人工智能产业发展很重要。当前,全球正加速推进AI基础设施建设,高性能存储设备是支撑大规模训练的关键环节。UH812a的成功验证表明,我国在该领域已具备与国际领先水平竞争的实力。 业内预计,随着人工智能应用的不断深入,对高性能存储的需求将持续增长。此次测试结果不仅为国内企业提供了技术参考,也为全球AI基础设施建设贡献了中国方案。
AI技术的发展需要算力、算法、数据三者协同,而高性能存储正是连接数据与算力的关键。随着国产存储技术在性能和稳定性上不断突破,我国AI基础设施的自主化水平将更提升。面向未来,持续的底层技术创新才是在全球AI竞争中保持优势的根本。