云天励飞开“大算力芯片战略前瞻会”，将未来三年的大算力ai 推理芯片计划给透了个底

2月3日，云天励飞开了个“大算力芯片战略前瞻会”，把未来三年的大算力AI推理芯片计划给透了个底。公司定下了“训练追赶、推理超车”的路线，把未来的目标定得很死：要让百万Tokens的成本直接降100倍，把技术体验变成生产力。公司董事长兼CEO陈宁说，训练芯片跟推理芯片的要求不一样。训练芯片要的是大带宽和精度，不太在乎钱；而推理芯片就得精打细算，盯着每一个Token的边际成本。他们现在盯着的是怎么把百万Tokens的价格从“一分钱”往下压到“0.1分钱”，最快在2028年实现这个目标。针对这个策略，CTO李爱军在会上聊了聊技术细节。他表示要把重心放在云推理场景上，给大模型设计两种芯片：一种叫P芯片（Prefill），专门对付高算力；另一种叫D芯片（Decode），专门管带宽。李爱军还提到，公司在芯片微架构里针对Attention和AFN这类计算特性做了精细优化。在一个有1024颗芯片的超节点里，P和D可以配合起来干活。接下来三年的规划也很清楚：今年先弄出第一代P芯片，算力水平对标Hopper架构；明年推出D芯片，目标是低时延；到了2028年还要搞第二代D芯片，争取赶上Rubin架构。关于中国芯片产业未来五年的走向，陈宁也给出了自己的看法。他觉得在训练芯片上要持续追赶；但在推理这块，靠着中国的应用场景、基础设施和开源生态，完全有机会实现超车。