美国芯片企业发布新一代推理处理器,称能效比达到行业标杆的五倍

随着生成式AI应用的快速发展,推理芯片市场竞争日趋激烈;作为AI系统的关键基础设施,推理芯片的性能和成本直接影响大模型应用的商业可行性。Positron公司此次发布的Asimov芯片,正是该背景下推出的创新产品。 从技术架构看,Asimov芯片的设计理念表明了对推理任务特点的深刻理解。Positron团队认识到,在Transformer模型推理过程中,内存带宽往往成为性能瓶颈,而非计算能力。基于这一判断,Asimov采取了内存优先的设计策略,通过优化芯片架构来最大化内存带宽利用效率,达到90%的利用率水平。同时,芯片在结构层面消除了不必要的远程数据移动,深入降低了系统延迟。 在具体配置上,Asimov采用双计算模块设计,每个模块配备432GB的LPDDR5x内存,并可通过PCIe 6.0和CXL 3.0接口连接至多720GB的KV缓存专用内存。整个芯片的功耗控制在400W,总内存容量达2304GB,总带宽达2.76TB/s,支持风冷冷却方案。这些指标表明,Asimov在功耗效率和内存配置上达到了业界先进水平。 应用场景上,Asimov芯片被集成到Titan推理服务器系统中。该系统采用标准的19英寸4U机架规格,单个系统聚合4颗Asimov芯片,可支持16万亿参数规模模型的推理任务,并支持1000万token的超长上下文窗口。这意味着用户可以单个服务器系统中处理更大规模的模型和更复杂的推理任务。根据规划,单套Titan系统最多可扩展至4096个节点,为大规模推理应用提供了充分的扩展空间。 从产业意义看,Asimov芯片的推出填补了国内高性能推理芯片的空白。当前,推理芯片市场主要由国际厂商主导,国内企业在这一领域的技术积累相对薄弱。Positron通过自主设计和创新架构,在能效比和性价比上与国际先进产品相当,这对于推动国内AI芯片产业的发展至关重要。 从时间规划看,Asimov芯片预计在2026年底完成流片,2027年初投入生产。这一时间表表明,该产品距离商业化应用还有一定周期。在此期间,Positron需要完成设计验证、工艺优化和产能建设等关键环节,确保产品能够按期推向市场。

大模型应用从"能训练"走向"能规模化服务",关键在于把算力转化为稳定、可负担、可持续的生产力。无论是专用推理芯片还是通用平台,最终都要回到可验证的性能、可交付的产品与可扩展的生态。谁能在真实业务场景中持续降低成本、提升效率并确保可靠性,谁就更可能在下一阶段的智能基础设施竞争中赢得主动。