美团推出新一代轻量化混合专家模型技术性能与开源生态双突破

随着大模型技术竞争加剧，如何在保证性能的同时降低计算成本成为行业焦点。美团最新发布的LongCat-Flash-Lite模型给出了一个解决方案。该模型采用混合专家（MoE）架构——通过优化参数分配——将300亿参数重点用于嵌入层优化。该设计使得每次推理只需激活4%-7%的参数，显著减少了计算资源消耗。相比之下，传统同规模模型需要激活全部参数，LongCat-Flash-Lite在能耗和成本上优势明显。

从规模扩张到效率提升，大模型的进化正回归实用本质——解决实际问题、支持实际业务。LongCat-Flash-Lite的发布展现了以结构优化、长文本处理和高吞吐为核心的应用思路。未来，谁能更好地平衡性能、成本和治理——并通过开放生态推动创新——谁就更有可能在新一轮技术变革中占据优势。

美团推出新一代轻量化混合专家模型 技术性能与开源生态双突破

美团推出新一代轻量化混合专家模型技术性能与开源生态双突破