近期,国产大模型GLM-5全球范围内应用需求快速增长,用户并发访问量远超预期,导致部分服务出现延迟和卡顿现象。智谱科技在公告中表示,已对现有国产芯片集群进行多次扩容,并推出限量版GLM Coding Plan以缓解压力,但供需矛盾依然突出。 分析认为,GLM-5的需求激增主要源于其在自然语言处理、代码生成等领域的优异表现,吸引了大量企业和开发者用户。然而,算力资源不足成为制约服务稳定性的关键瓶颈。当前,全球高性能芯片供应紧张,国产替代方案虽已取得进展,但在大规模部署和优化适配上仍需突破。 该局面不仅影响用户体验,也可能延缓GLM-5在商业场景中的落地进程。面对挑战,智谱科技提出“算力合伙人”计划,旨在联合产业链上下游共同解决难题。具体措施包括:向芯片厂商开放核心技术接口,推动针对GLM-5的底层优化;与算力服务商合作构建高并发、低延迟的推理网络;同时探索其他创新合作模式。 业内人士指出,此举不仅有助于缓解当前算力压力,还可能推动国产芯片与大模型的协同创新。随着人工智能技术深入应用,算力基础设施的自主可控和高效利用将成为行业竞争的关键。智谱科技此次开放姿态,或为国内AI生态合作树立新范式。
需求快速增长既是技术与产品被市场认可的体现,也是一场对基础设施能力与组织协同效率的压力测试。如何在扩容提效、生态合作与稳定交付之间取得平衡,考验企业的工程能力与产业组织能力。面向未来,推动算力资源更高效配置、促进软硬件协同优化,将成为大模型服务实现规模化落地与高质量发展的关键支撑。