问题:随着生成式应用深入业务流程,智能体式人工智能对“长上下文”“持续记忆”和实时检索的依赖明显增加;行业普遍遇到的矛盾是:算力增长很快,但通用存储体系仍以较长的数据路径和较高访问时延为主,推理阶段经常等待数据,计算资源难以持续满载,系统整体效率受到限制。 原因:传统数据中心多采用“计算—网络—存储”的分层架构,数据从存储介质到计算加速器需要经过较长链路,协议栈也更复杂。智能体式应用的请求通常包含多轮检索、工具调用与上下文拼接,访问特征呈现高频小块、随机读写且对低时延敏感。若继续以通用存储为中心组织数据,排队与抖动会被放大,深入压低推理吞吐并影响交互体验。 影响:英伟达在大会上发布BlueField-4 STX模块化存储参考架构,目标是让存储与网络、计算更紧密耦合。其首个机架级部署方案集成了NVIDIA CMX上下文内存存储平台,针对上下文数据的访问与调度进行优化,宣称每秒处理Token数量最高可提升约5倍。该方案以BlueField-4处理器为核心,结合Vera CPU、ConnectX-9超级网卡,并与Spectrum-X以太网及DOCA、企业软件套件协同运行。英伟达同时表示,相比传统CPU主导方案,该架构能效最高可提升约4倍;在企业级数据处理场景中,数据摄取速度可实现翻倍,为训练与推理提供更连续的数据供给。 对策:从产业推进方式看,BlueField-4 STX更像一套可复用、可组装的参考架构,而非单一硬件产品,重点在于与主流厂商联合设计与适配。英伟达称,戴尔、HPE、IBM等存储与服务器供应商正基于STX思路推进下一代基础设施方案;在应用侧,甲骨文云等云服务商以及Mistral AI等机构计划率先采用有关技术,并预计在当年下半年推动产品化落地。业内分析认为,“参考架构+生态伙伴”的模式有助于缩短从技术展示到规模部署的周期,但能否形成广泛采用,仍取决于软硬件协同的成熟度、与既有存储体系的兼容改造成本,以及在真实业务负载下的稳定性与可运维性。 前景:面向智能体式应用,基础设施演进正从“扩算力”转向“重构数据路径”。未来一段时间,存储系统的价值将不再只看容量与带宽,更强调对上下文数据的分层、缓存、调度与安全隔离能力,并与网络和加速计算形成端到端的一体化优化。随着企业对实时决策、低时延交互与持续学习的要求提升,“近计算存储”“上下文内存化”“数据摄取流水线化”等技术路线可能加速落地,推动数据中心在能耗约束下实现更高的单位能效产出。
BlueField-4 STX的发布表明,AI与存储的深度融合正在进入新阶段。基础设施从“存得下”走向“供得快、供得稳”,也反映出AI产业对数据路径效率与实时响应能力的更高要求。随着该架构推进商用并带动产业链协同,AI数据中心的效率瓶颈有望被继续缓解,为智能应用的规模化部署提供支撑,并将影响未来数据中心架构设计与企业的AI基础设施选择。