做LLM芯片的MatX刚刚搞定5亿美元的B轮融资,折合人民币大概34亿。这家公司的老板可是前谷歌TPU工程师,这次他们要推出一款叫MatX One的革命性产品。这个芯片把脉动阵列和混合内存设计结合在一起,让LLM的吞吐量和延迟都有了新突破,以后可能会把整个AI算力的成本格局给改变了。 听说MatX把SRAM的低延迟和HBM的长上下文处理能力都给整进去了,这样就能做到训练、预填充、推理解码还有强化学习这些任务都能兼顾。还有世芯AIchip、美满Marvell这些行业大佬也都参与进来投资了。这种可分割的脉动阵列结构挺有意思,既保留了大型阵列的高效能和面积利用率,又具备小型阵列的灵活性和高利用度。这次推出的MatX One不仅能带来更低的LLM使用成本,还能在各类场景下都有不错的表现。