国产ai 芯片技术再上新台阶

在这次华为中国合作伙伴大会上,大家的目光全都聚焦到了一款叫Atlas 350的AI加速卡上。这款产品配备了华为新开发的昇腾950PR芯片,有好多性能上的突破,这也表明咱们国产AI芯片技术又上了一个新台阶。 咱们先说说它的低精度计算能力,这块儿做得特别好。它的FP4精度算力达到了1.56P,比老款产品强了不少,单卡算力比英伟达H20还要高出2.87倍。现在国内就只有这个产品支持这种精度的推理了,这个优势让服务器在处理大模型的时候,既跑得快,又能省电。 内存这块也有大变化。这个加速卡用了华为自研的HBM,容量有112GB,带宽1.4TB/s,比同类产品提升了16%。把内存访问的大小从512字节压缩到128字节后,系统处理小规模运算的效率快了4倍,多模态生成速度也因此提升了60%。这下可好了,以前困扰AI计算的访存瓶颈问题算是解决了。 华为昇腾的负责人也透了个底,说以后要基于Atlas 350打造一套覆盖大中小各种场景的解决方案。不管是智慧城市还是医疗影像这些领域,合作伙伴都能找到合适的配置来用。这样灵活的策略肯定能帮大家更快地智能化起来。 值得一提的是,虽然这款产品的功耗是600W,比H20高了50%,但单位算力消耗的能源还是领先的。这就把性能需求和数据中心的运营成本给平衡好了,给大规模部署提供了基础。 专家们都觉得FP4这种低精度格式以后会很流行。精度变小了意味着寄存器利用率高,也不需要那么多带宽了。像自动驾驶、金融风控这些需要实时响应的场景特别需要这种技术。Atlas 350的推出,让国产芯片在关键领域替代进口产品有了新路子。