3月26日,全球存储芯片对应的个股普遍下跌;A股市场中——恒烁股份收盘跌幅超过6%——兆易创新、佰维存储、朗科科技跌幅均超5%,江波龙、北京君正等个股跟跌。美股开盘后,存储板块同样承压,截至北京时间22时30分,闪迪跌超6%,美光科技、西部数据跌超4%,希捷科技跌超3%。市场分析认为,此次调整的直接诱因并非行业供需变化,而是一篇技术论文引发的市场预期调整。 原因: 论文聚焦大模型推理环节的“键值缓存”(KV Cache)问题。对话和长文本处理中,模型需保留上下文信息以保持输出连贯性,这部分缓存随上下文窗口扩大而快速膨胀,增加了显存和内存带宽压力,成为推理成本、并发规模和响应速度的主要瓶颈。论文提出的“TurboQuant”方案通过更激进的量化压缩降低缓存占用,并在特定硬件平台上展示了吞吐量提升的测试结果。市场担忧,若算力内存利用效率显著提高,云服务商和企业用户的存储采购需求可能随之减少。 影响: 业内分析指出,市场抛售更多是情绪化反应而非对技术边界的理性评估。一上,大模型近年带动高带宽内存和服务器存储需求快速增长,相关资产估值较高;任何可能降低硬件消耗的技术方案都可能引发需求预期调整。另一方面,技术进步往往伴随需求扩张:推理效率提升可能支持更长上下文、更大批处理和更高并发,反而可能推动整体推理调用量上升,存储需求未必线性下滑。 多家机构提醒,应区分“缓存占用下降”与“总体存储需求减少”。摩根士丹利报告指出,该方案主要影响推理阶段的键值缓存,对模型权重占用的高带宽内存影响有限,也不涉及训练环节的算力和内存配置逻辑。另有研究人士表示,行业已普遍采用低比特量化和多种优化手段,论文的性能对比和适用范围仍需验证,结论外推需谨慎。 对策: 面对推理端的技术创新,产业链应关注两大方向:一是内存与存储形态的结构升级。随着推理向长上下文、复杂任务和端云协同发展,高带宽内存、先进封装、存算协同和系统优化的重要性提升,硬件需求可能从容量扩张转向带宽、能效和集成度竞争。二是客户成本模型重构。云服务商更关注单位吞吐成本和稳定性,在技术未规模化落地前,采购策略通常渐进调整;存储企业需通过产品组合优化、工艺升级和定制化方案增强抗风险能力。 前景: 综合业内观点,推理优化技术短期可能压制部分环节的高增长预期,但中长期看,若成本下降推动更多场景落地,数据生成、调用频次和系统扩容仍将支撑存储需求。更值得关注的是需求结构变化:高带宽、低时延、低功耗和高可靠性要求将提升,行业竞争重点或从产能扩张转向技术能力和供给体系比拼。
技术进步通常以降低成本和提高效率的形式出现,但其结果未必是需求收缩,更多是推动产业从增量扩张转向结构升级。面对新技术引发的市场波动,既要承认短期预期调整的合理性,也要基于可验证的数据、可行的路径和可持续的商业逻辑判断长期趋势。