英伟达发布Nemotron 3 Super并拟五年投入260亿美元，加速“开放权重”大模型生态布局

在全球人工智能技术竞争加速的背景下，英伟达近日推出一款具有里程碑意义的开源大模型，迅速引发业内关注；此动作不仅说明了其技术推进能力，也折射出人工智能产业的新走向。当前，AI应用正从单点能力展示转向系统化部署。企业级用户主要面临两类瓶颈：其一，多智能体协作带来的“上下文爆炸”问题，使传统模型在复杂工作流中出现内存占用高、计算效率低等短板；其二，推理成本长期偏高，直接影响AI的规模化落地。行业测算显示，在多任务场景下，传统模型的Token处理量可能放大至15倍，显著推高企业算力成本。针对上述问题，英伟达推出的Nemotron 3 Super模型采用混合专家架构（MoE），通过选择性激活120亿参数，在维持性能的同时降低计算负载。模型支持百万级Token的超大上下文窗口，可一次性纳入完整业务状态，减少目标偏移。配合Latent MoE技术与多Token预测算法，其推理速度较传统方案提升300%。在最新Blackwell计算平台上，FP4精度相较前代FP8标准，内存占用减少三分之二，运算效率提升四倍。有一点是，英伟达此次采用“开放权重”的折中策略。不同于完全封闭或完全开源的路线，该公司公开模型权重、训练配方以及超过10万亿Token的训练数据集，同时保留部分核心技术的知识产权。该策略在兼顾商业利益的同时，也为开发者留出足够的定制空间。目前，该模型已上线Hugging Face，并计划在谷歌云、甲骨文、AWS和Azure等主流云平台部署。另外，英伟达还公布了一项为期五年、总额260亿美元的投资计划，规模明显高于多数科技公司在AI领域的投入。分析人士认为，通过深入绑定自研GPU与DPU硬件，英伟达有望推动算力优化与软件服务协同发展，完善自身AI生态布局。

英伟达此举具有示范意义。其在开源与商业化之间选择“开放权重而非开放源代码”，在提升开发者可用性和生态活跃度的同时，也为自身保留技术优势与商业空间。这种更开放但更克制的路线，可能为AI产业提供新的参考。随着更多自研大模型持续推出并进入实际部署，英伟达从芯片供应商向AI基础设施与服务提供商延伸的趋势将更加清晰，并有望深入影响行业竞争格局与生态演进。