CES 2026英伟达宣布Vera Rubin平台全面投产,推理性能跃升并加速代理式与物理智能落地

在全球科技竞争日益激烈的背景下,算力基础设施的创新突破成为推动人工智能发展的关键因素。

美国当地时间1月6日,英伟达公司在拉斯维加斯举办的CES 2026展会上,正式发布了新一代超级计算平台Vera Rubin,引发业界广泛关注。

此次发布的新一代平台在性能指标上实现重大突破。

据技术参数显示,Rubin GPU的推理性能达到上一代Blackwell平台的5倍,训练性能提升3.5倍,内存带宽提升2.8倍。

这一突破性进展主要得益于第三代Transformer引擎的应用和六芯片协同设计的创新架构。

英伟达首席执行官黄仁勋在长达90分钟的演讲中指出,人工智能发展正经历从"生成式AI"向"代理式AI"和"物理AI"的转变。

这一趋势对计算平台提出了更高要求,需要解决长期运行AI推理任务时面临的算力、网络和存储等多重瓶颈问题。

针对这些挑战,Vera Rubin平台采用了系统性解决方案。

平台集成了Rubin GPU、Vera CPU等六大核心组件,通过优化架构设计,将推理成本降至Blackwell平台的十分之一,训练混合专家模型所需的GPU数量减少四分之一。

这一创新不仅提升了性能,还显著降低了运行成本。

在应用层面,该平台将推动多个领域的突破性发展。

自动驾驶领域,英伟达发布了全球首个开源的视觉-语言-行动推理模型Alpamayo,其链式推理能力可理解复杂场景中的因果关系。

首款搭载完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型预计2026年第一季度在美国上路。

机器人技术方面,英伟达展示了GR00T系列基础模型的进展。

黄仁勋预测,机器人产业将成为未来最大产业之一。

同时,公司还扩展了"Open Model Universe"开源模型库,覆盖机器人、物理AI、生物医学等多个关键领域。

为应对AI智能体长期运行产生的海量数据存储挑战,英伟达推出了由BlueField-4 DPU驱动的推理上下文内存存储平台。

该创新在GPU高速内存与传统存储之间建立新的"记忆层",实现每秒处理令牌数提升最高5倍的效果。

市场反应显示,截至发布会当日,Rubin相关订单已达3000亿美元。

新一代DGX SuperPOD系统可协同576个Rubin GPU工作,为超大规模AI训练和推理任务提供集群级解决方案。

Rubin GPU的发布不仅代表着计算技术的重大进步,更预示着人工智能产业即将迎来新一轮变革浪潮。

随着算力成本的大幅降低和性能的显著提升,人工智能技术有望在更广泛的领域实现深度应用,推动全球数字经济转型升级。

这一技术突破将为构建更加智能化的未来社会奠定坚实基础,值得各界持续关注其后续发展和应用前景。