(问题)近日,编程类大模型服务在使用高峰期出现拥堵,引发关注。智谱公告指出,部分用户在工作日下午3点至6点的集中调用时段遇到并发限制、响应速度下降等问题。这不仅影响开发效率,也让用户对服务稳定性产生疑虑。 (原因)业内人士分析,编程类大模型对算力资源需求大,且峰值负载明显。产品升级后,新用户和调用频次往往短期内快速增长,形成"需求增长快、资源供给慢、高峰拥堵"的矛盾。加上模型推理任务特点是请求密集、时延敏感,一旦调度和资源配置跟不上,高峰期就容易触发限流、队列积压。此外,平台提到的恶意流量治理也反映出,非正常请求可能更挤占公共资源,加剧拥堵。 (影响)从用户角度看,限流和响应变慢会直接延长编码、测试和联调周期,对频繁调用的团队协作和自动化流程影响尤为明显。从平台角度看,服务体验波动会影响口碑和商业转化,也对产品迭代提出更高要求。对整个行业而言,如何在快速增长阶段保持稳定供给、优化峰值管理,是大模型服务规模化应用必须解决的问题。 (对策)针对该阶段性困境,智谱推出"保存量、控增量、抓治理、促扩容"的组合方案。首先,为保障现有用户体验,平台暂时限量销售GLM Coding Plan,日销售量降至现有水平的20%,以释放更多算力给存量用户。限售从1月23日10点开始,每日10点刷新可购额度。其次,已有自动续订用户不受影响,确保服务连续性。再次,平台已启动扩容并加强恶意流量治理,通过增加资源供给和优化访问秩序双管齐下,减少异常请求对公共资源的占用。 (前景)从公告看,平台短期内以稳定体验为首要目标,通过限售和调度治理缓解高峰压力。中长期效果取决于扩容进度、资源调配能力和异常流量识别水平。随着模型能力提升和应用场景落地加速,编程类模型服务需求预计继续增长,供给侧需要更精细的容量规划和峰值管理,包括弹性资源池、分时调度优化、分层服务和更透明的容量提示等。智谱提到正在研发更强大高效的模型,算力扩容也在加速推进。若供给能力持续提升,限售措施有望逐步退出,服务回归更稳定、可预期的状态。
智谱科技的此次调整既表明了对用户的负责,也为行业提供了启示——在技术创新和市场拓展中,基础设施建设同样重要。如何平衡发展速度与服务品质,将是人工智能企业长期面临的课题。