2026年的gtc 大会上,英伟达终于把那个groq3 lpx 机架拿出来了,这在ai 推理和

这回2026年的GTC大会上,英伟达终于把那个Groq3 LPX机架拿出来了,这在AI推理和太空计算上简直是翻天覆地的大进步。特别是2026年3月17日这天,大家伙儿都在盯着看。咱们东方证券的研究报告里也说了,这机架里装的Groq3 LP30 LPU很有门道,用的是扁平的SRAM为主的平面内存架构,专门为了能快速又稳当地生出token去。单个机架里塞了32个液冷的1U计算托盘,加起来有315 PFLOPS的算力,还有128GB的SRAM容量,总带宽更是能跑到640TB/s。把它跟Rubin机架搭在一块儿用,相比老款的Blackwell架构,处理万亿参数模型的时候,每兆瓦的token能力能翻35倍,赚钱的机会也多了不止10倍。 这东西把以前高端模型推理那种单GPU系统太贵的问题给解决了。以后云服务商要是用Rubin加LPX的部署方式,既能省钱又能多赚钱,低时延的AI推理应用肯定会落地更快。而且这还能带动PCB、液冷、供电、光通信还有铜缆这些领域的需求大涨。 除了这个大家伙儿,英伟达还掏出了Vera CPU机架。这东西可是未来搞大规模AI agent和强化学习的核心。每个机架有32个液冷的Vera CPU托盘,每8颗CPU配上2颗BlueField DPU,里面是Olympus核心。比起传统的x86 CPU,单线程性能直接提了50%。整个机架加起来有256颗CPU,内存堆到了400TB带宽也有300TB/s。 用这个机架跑强化学习或者Agentic沙箱环境能同时搞定超过22500个任务。它比老款机架高效两倍还快50%。这算是帮AI agent的发展开了个好头,以后AI不光是给建议了,还能直接干活执行任务。CPU那个超快的单线程性能能让频繁调用工具这种活变得更利索。 另外他们还发布了Space-1太空模组,这标志着太空计算迈了一大步。跟合作伙伴一起搞出来的Space-1 Vera Rubin Module太空计算机模组就是为了在太空环境里算得更好更快。还有Rubin Ultra Kyber架构也跟着出来了,交换板之间连在一块儿特别稳当。Kyber NVL144用光互连还能扩展到NVL1152这么大的规模。 有了这些新技术和新架构,相关的产业链肯定都要火一把。比如做PCB的沪电股份、胜宏科技还有景旺电子;做液冷的英维克、领益智造和申菱环境;搞太空算力的复旦微电还有成都华微这些公司都能跟着沾光。不过东方证券也特意提醒大家风险不小,毕竟AI发展不一定跟预期一样顺利。行业竞争也会变激烈,加上国际上那些事儿也得操心着点。 总的来说这两个新机架的出现真把AI推理给彻底改变了模样。太空计算的大门也被彻底打开了。以后相关产业链的企业肯定会迎来一波大的增长机会。大伙儿都得高度关注这个领域才行。