英伟达发布新一代计算平台推动全球AI基础设施升级

英伟达在圣何塞SAP中心召开的GTC大会上，表现出了对AI产业未来的宏大布局；黄仁勋用近两个小时的演讲时间，系统阐述了英伟达从基础芯片制造到终端应用的全景战略，并给出了一个令业界瞩目的数字目标：2025年至2027年间，全球AI芯片营收将突破1万亿美元大关。该预判反映了当前AI产业发展的深刻变化。随着生成式AI技术的广泛应用和智能体时代的来临，对算力基础设施的需求呈现指数级增长。传统芯片市场已难以满足这一需求，AI芯片市场正成为全球科技产业的新增长极。英伟达的万亿美元预期，既反映了对市场前景的乐观判断，也反映了其在产业链中的核心地位。 Vera Rubin平台是本次发布会的核心。这一产品由七颗芯片组成，包括Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换芯片及整合的Groq 3 LPU。七颗芯片均已投产，设计目标是形成协同工作的超级计算机，覆盖AI模型从预训练、后训练、测试时推理到实时智能体推理的全流程。与上一代Blackwell平台相比，Vera Rubin NVL72机架在训练大规模混合专家模型时所需的GPU数量减少到四分之一，推理吞吐量每瓦提升10倍，每token成本降至十分之一。这些指标的明显提高，意味着企业和开发者在构建AI应用时的成本和门槛将大幅降低，从而加速AI技术的普及应用。黄仁勋强调，智能体的拐点已经到来，Vera Rubin平台正在开启历史上最大规模的基础设施建设。这一判断基于对AI发展阶段的深入认识。在他看来，AI产业正在经历从训练到推理、再到智能体和物理AI的演进，每个阶段都对应更大规模的基础设施需求。推理市场的重要性在本次发布中得到了充分强调。相比训练是一次性的任务，推理是持续的、日常的需求。黄仁勋将大语言模型推理分为两个阶段：prefill（预填充）和decode（解码）。前者处理用户输入的提示词，属于计算密集型任务，适合GPU处理；后者逐个生成回答token，属于带宽密集型任务，需要极高的内存读取速度。英伟达收购Groq并推出Groq 3 LPU，正是针对decode阶段的专用芯片解决方案，体现了对推理市场差异化需求的深刻理解。在AI芯片之外，英伟达的生态扩展已覆盖多个领域。自研CPU Vera专为智能体而设计，DLSS 5将神经渲染引入游戏画面，NemoClaw开源模型联盟汇聚Mistral、Perplexity、Cursor等多家AI公司。在自动驾驶领域，比亚迪、吉利、日产、五十铃等车企接入英伟达DRIVE Hyperion平台，Uber宣布2028年前在28个城市部署英伟达全栈自动驾驶车队。机器人基础模型GR00T N2的发布，以及太空计算能力的部署计划，深入拓展了英伟达的产业版图。这种全链条的产业布局反映了英伟达对AI时代商业逻辑的深刻认识。黄仁勋提出，在AI时代，token是新的货币，AI工厂是生产token的基础设施。从这个逻辑出发，无论是训练芯片、推理芯片、CPU、网络芯片，还是应用层的自动驾驶、机器人、游戏引擎，英伟达都在每一个环节布置了产品和解决方案，形成了完整的价值链闭环。英伟达还预告了下一代架构Kyber，采用垂直插入的计算托盘设计，将于2027年搭载在Vera Rubin Ultra上出货。这表明英伟达的技术演进路线已经规划到数年之后，显示出对长期市场趋势的自信把握。

从训练到推理，从硬件到系统，算力产业正在经历应用驱动的重构。面对市场机遇，行业需要平衡技术创新与能耗、成本等现实约束，通过开放合作提升整体效率，实现AI能力的普惠化落地。

英伟达发布新一代计算平台 推动全球AI基础设施升级

英伟达发布新一代计算平台推动全球AI基础设施升级