云天励飞开“大算力芯片战略前瞻会”,将未来三年的大算力ai 推理芯片计划给透了个底

2月3日,云天励飞开了个“大算力芯片战略前瞻会”,把未来三年的大算力AI推理芯片计划给透了个底。公司定下了“训练追赶、推理超车”的路线,把未来的目标定得很死:要让百万Tokens的成本直接降100倍,把技术体验变成生产力。公司董事长兼CEO陈宁说,训练芯片跟推理芯片的要求不一样。训练芯片要的是大带宽和精度,不太在乎钱;而推理芯片就得精打细算,盯着每一个Token的边际成本。他们现在盯着的是怎么把百万Tokens的价格从“一分钱”往下压到“0.1分钱”,最快在2028年实现这个目标。 针对这个策略,CTO李爱军在会上聊了聊技术细节。他表示要把重心放在云推理场景上,给大模型设计两种芯片:一种叫P芯片(Prefill),专门对付高算力;另一种叫D芯片(Decode),专门管带宽。李爱军还提到,公司在芯片微架构里针对Attention和AFN这类计算特性做了精细优化。在一个有1024颗芯片的超节点里,P和D可以配合起来干活。 接下来三年的规划也很清楚:今年先弄出第一代P芯片,算力水平对标Hopper架构;明年推出D芯片,目标是低时延;到了2028年还要搞第二代D芯片,争取赶上Rubin架构。 关于中国芯片产业未来五年的走向,陈宁也给出了自己的看法。他觉得在训练芯片上要持续追赶;但在推理这块,靠着中国的应用场景、基础设施和开源生态,完全有机会实现超车。