sk海力士为hbm和hbf做了差异化的安排

SK 海力士把目光投向了H3存储技术。他们想把HBM和HBF的优势给组合起来，以此提高AI推理的能效。为了实现这个目标，SK海力士给HBM和HBF做了差异化的安排：把HBF当成HBM的二级扩展，用它来存储只读数据，剩下的才交给HBM。这个设计能同时增加带宽和容量，给大规模的LLM推理提供了高效的方案。具体到硬件结构上，SK海力士把GPU和HBM的Base Die给连在了一起。HBM的Base Die内部集成了控制器，还加上了一个延迟隐藏缓冲，负责处理和HBF系统之间的交互。这个缓冲让HBF的读写延迟得到了缓解，进一步提升了整体的访问速度。 H3架构最适合处理那些只读数据量特别大的场景，比如LLM推理中用的共享预计算键值缓存。测试结果显示，用了H3之后，单位功耗的吞吐量提高了2.69倍，明显比单纯用HBM划算得多。IT之家方面给出的数据也证明了这一点：和传统的系统相比，H3在处理海量只读数据时的成本效益特别高。SK海力士这次提出的混合存储架构，为AI算力时代的发展提供了一种新的思路。