英伟达在圣何塞SAP中心召开的GTC大会上,表现出了对AI产业未来的宏大布局;黄仁勋用近两个小时的演讲时间,系统阐述了英伟达从基础芯片制造到终端应用的全景战略,并给出了一个令业界瞩目的数字目标:2025年至2027年间,全球AI芯片营收将突破1万亿美元大关。 该预判反映了当前AI产业发展的深刻变化。随着生成式AI技术的广泛应用和智能体时代的来临,对算力基础设施的需求呈现指数级增长。传统芯片市场已难以满足这一需求,AI芯片市场正成为全球科技产业的新增长极。英伟达的万亿美元预期,既反映了对市场前景的乐观判断,也反映了其在产业链中的核心地位。 Vera Rubin平台是本次发布会的核心。这一产品由七颗芯片组成,包括Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换芯片及整合的Groq 3 LPU。七颗芯片均已投产,设计目标是形成协同工作的超级计算机,覆盖AI模型从预训练、后训练、测试时推理到实时智能体推理的全流程。 与上一代Blackwell平台相比,Vera Rubin NVL72机架在训练大规模混合专家模型时所需的GPU数量减少到四分之一,推理吞吐量每瓦提升10倍,每token成本降至十分之一。这些指标的明显提高,意味着企业和开发者在构建AI应用时的成本和门槛将大幅降低,从而加速AI技术的普及应用。 黄仁勋强调,智能体的拐点已经到来,Vera Rubin平台正在开启历史上最大规模的基础设施建设。这一判断基于对AI发展阶段的深入认识。在他看来,AI产业正在经历从训练到推理、再到智能体和物理AI的演进,每个阶段都对应更大规模的基础设施需求。 推理市场的重要性在本次发布中得到了充分强调。相比训练是一次性的任务,推理是持续的、日常的需求。黄仁勋将大语言模型推理分为两个阶段:prefill(预填充)和decode(解码)。前者处理用户输入的提示词,属于计算密集型任务,适合GPU处理;后者逐个生成回答token,属于带宽密集型任务,需要极高的内存读取速度。英伟达收购Groq并推出Groq 3 LPU,正是针对decode阶段的专用芯片解决方案,体现了对推理市场差异化需求的深刻理解。 在AI芯片之外,英伟达的生态扩展已覆盖多个领域。自研CPU Vera专为智能体而设计,DLSS 5将神经渲染引入游戏画面,NemoClaw开源模型联盟汇聚Mistral、Perplexity、Cursor等多家AI公司。在自动驾驶领域,比亚迪、吉利、日产、五十铃等车企接入英伟达DRIVE Hyperion平台,Uber宣布2028年前在28个城市部署英伟达全栈自动驾驶车队。机器人基础模型GR00T N2的发布,以及太空计算能力的部署计划,深入拓展了英伟达的产业版图。 这种全链条的产业布局反映了英伟达对AI时代商业逻辑的深刻认识。黄仁勋提出,在AI时代,token是新的货币,AI工厂是生产token的基础设施。从这个逻辑出发,无论是训练芯片、推理芯片、CPU、网络芯片,还是应用层的自动驾驶、机器人、游戏引擎,英伟达都在每一个环节布置了产品和解决方案,形成了完整的价值链闭环。 英伟达还预告了下一代架构Kyber,采用垂直插入的计算托盘设计,将于2027年搭载在Vera Rubin Ultra上出货。这表明英伟达的技术演进路线已经规划到数年之后,显示出对长期市场趋势的自信把握。
从训练到推理,从硬件到系统,算力产业正在经历应用驱动的重构。面对市场机遇,行业需要平衡技术创新与能耗、成本等现实约束,通过开放合作提升整体效率,实现AI能力的普惠化落地。