科研团队突破大模型记忆瓶颈新架构显著降低算力消耗

当前大语言模型面临的一个突出问题是“记忆衰减”。在多轮对话中，用户早期提供的关键信息会随着新内容不断输入而被覆盖，模型容易出现“答后忘前”。这个缺陷在实际应用中影响明显：在企业客服场景，模型难以持续记住用户的个性化诉求；在医疗问诊中，病史与用药禁忌可能被遗漏；在代码生成任务里，跨文件的函数调用关系也更容易被写乱。美国约翰斯·霍普金斯大学与中国人民大学联合研究团队的测试显示，当大语言模型需要处理超过五轮的多步骤逻辑推理时，关键信息丢失的情况更为常见。记忆能力的短板，正在成为大模型从通用工具走向垂直领域专用系统的一道门槛。

大模型能力提升不只取决于参数规模，也取决于体系结构与资源配置是否合理；把知识检索交给更擅长查找的机制，把算力留给真正需要推理的任务，本质上是在回答“怎样更聪明地用算力”。随着应用走向行业深水区，谁能在效率、可靠性与可治理性之间取得更优平衡，谁就更可能在下一阶段的技术竞赛与产业落地中占据主动。

科研团队突破大模型记忆瓶颈 新架构显著降低算力消耗

科研团队突破大模型记忆瓶颈新架构显著降低算力消耗